2025/06/29

☕ Nhàn đàm ICT: Trends – Artificial Intelligence 📈

Phác họa bài post:

🛈. Đề dẫn.

. Có vẻ như thay đổi đang diễn ra nhanh hơn bao giờ hết?

. Sự tăng trưởng về người dùng AI, mức độ sử dụng và chi tiêu vốn = Chưa từng có tiền lệ

. Chi phí tính toán cho mô hình AI cao / đang tăng + Chi phí suy luận trên mỗi token đang giảm = Hiệu suất đang hội tụ + Mức độ sử dụng bởi nhà phát triển gia tăng

. Mức sử dụng AI + Chi phí + Tăng trưởng thua lỗ = Chưa từng có tiền lệ

. Các mối đe dọa đến việc kiếm tiền từ AI = Cạnh tranh gia tăng + Đà phát triển của mã nguồn mở + Sự trỗi dậy của Trung Quốc

. Sự mở rộng của AI và thế giới vật lý = Nhanh chóng + Dựa trên dữ liệu

. Sự gia tăng người dùng Internet toàn cầu được thúc đẩy bởi AI ngay từ đầu = Mức độ tăng trưởng chưa từng thấy trước đây

. Sự tiến hóa của AI và công việc = Thực tế + Nhanh chóng

🤔. Suy ngẫm chậm.

~

Để giúp anh/chị quyết định có đọc tiếp hay không, tôi xin phép cung cấp các thông tin liên quan đến bài post này như sau:

·       Chủ đề: Machine Learning

·       Tính thời sự: tháng 5/2025

·       Thời gian đọc: 10 phút, kể cả thời gian uống cà phê (uống cà phê xong là đọc xong)

📈

🛈. Đề dẫn.

Gần đây, tôi có đọc được một bài nói về Xu hướng AI của nhóm tác giả Mary Meeker / Jay Simons / Daegwon Chae / Alexander Krey: Trends – Artificial Intelligence, và muốn chia sẻ cùng anh/chị trên diễn đàn. Bài rất dài, gồm 340 slides với đầy ắp số liệu và biểu đồ. Tuy dài nhưng hay rất đáng để tham khảo.

Trong nhóm tác giả, chúng ta để ý có Mary Meeker – được mệnh danh là “Queen of the Internet” (Nữ hoàng Internet). Bà đã xuất bản ấn phẩm đầu tiên của “Internet Trends Report (Báo cáo Xu hướng Internet) vào năm 1995 – một nghiên cứu chuyên sâu dày 322 trang về tiềm năng của web.

Bà đã sớm nhận định nhiều xu hướng:

(a) 1996 → Bùng nổ dân số trực tuyến (tăng gấp 10 lần vào năm 2000)

(b) 2000 → Quảng cáo trực tuyến vượt qua quảng cáo in (điều này đã xảy ra vào năm 2004)

(c) 2008 → Sự thống trị của di động (diễn ra vào năm 2014)

Bà đã tạm dừng viết báo cáo Xu hướng Internet vào năm 2019 nhưng đã trở lại tháng 5/2025 với bài viết về AI như đã dẫn ở trên.

-

Gần như tất các các slides của bài viết đều là các biểu đồ, đồ họa, đầy ắp thông tin. Tất cả đều dựa vào cứ liệu của các công ty chuyên về nghiên cứu phát triển công nghệ, các trường đại học danh tiếng hoặc của chính các tech giants như OpenAI, Google, Microsoft, NVIDIA, … Tôi cũng đã nhờ các LLM làm tóm tắt. Tuy nhiên, chúng có vẻ như bị “ngợp” về lượng thông tin nên các tóm tắt đó không nêu được cái “hồn” của bản báo cáo.

-

Bài viết được chia thành 8 mục, tôi tạm dịch từ tiếng Anh ra tiếng Việt như sau:

❶. Có vẻ như thay đổi đang diễn ra nhanh hơn bao giờ hết?

❷. Sự tăng trưởng về người dùng AI, mức độ sử dụng và chi tiêu vốn = Chưa từng có tiền lệ

❸. Chi phí tính toán cho mô hình AI cao / đang tăng + Chi phí suy luận trên mỗi token đang giảm = Hiệu suất đang hội tụ + Mức độ sử dụng bởi nhà phát triển gia tăng

❹. Mức sử dụng AI + Chi phí + Tăng trưởng thua lỗ = Chưa từng có tiền lệ

❺. Các mối đe dọa đến việc kiếm tiền từ AI = Cạnh tranh gia tăng + Đà phát triển của mã nguồn mở + Sự trỗi dậy của Trung Quốc

❻. Sự mở rộng của AI và thế giới vật lý = Nhanh chóng + Dựa trên dữ liệu

❼. Sự gia tăng người dùng Internet toàn cầu được thúc đẩy bởi AI ngay từ đầu = Mức độ tăng trưởng chưa từng thấy trước đây

❽. Sự tiến hóa của AI và công việc = Thực tế + Nhanh chóng

-

Trong lần nhàn đàm này tôi chỉ xin giới thiệu với anh/chị một số slides mà tôi cho là hấp dẫn của mục đầu tiên “❶. Có vẻ như thay đổi đang diễn ra nhanh hơn bao giờ hết?”.

Để hỗ trợ báo cáo này tôi sử dụng các chatbot phiên bản miễn phí: ChatGPT (của OpenAI), Gemini (của Google) và Claude (của Anthropic).

📈

. Có vẻ như thay đổi đang diễn ra nhanh hơn bao giờ hết?

ⓐ. Hiệu ứng cộng dồn của công nghệ = Những con số đứng sau động lực tăng trưởng

Nguồn: snapshot slide #12

“GDP toàn cầu – Hơn 1.000 năm qua, theo Dự án Maddison”. Biểu đồ thể hiện GDP ước tính của toàn thế giới từ năm 1000 đến năm 2000, sử dụng thang đo logarit, với các cột mốc công nghệ quan trọng được chú thích dọc theo trục thời gian.

Đặc điểm chính:

  • Trục tung (dọc): GDP toàn cầu tính theo đô la điều chỉnh theo lạm phát, dao động từ 500 tỷ USD đến hơn 100 nghìn tỷ USD.
  • Trục hoành (ngang): Các năm từ 1000 đến 2000.
  • Đường xu hướng:
    • Gần như phẳng và tăng trưởng chậm từ năm 1000 đến khoảng năm 1700.
    • Tăng trưởng mạnh mẽ sau Cách mạng Công nghiệp (~1700), và tăng vọt theo cấp số nhân vào thời hiện đại.

Các cột mốc công nghệ được chú thích:

  • 1400s: Máy in
  • 1700s: Động cơ hơi nước
  • 1800s: Điện báo, điện khí hóa, sản xuất thép hàng loạt, sản xuất hàng loạt & dây chuyền lắp ráp, động cơ đốt trong
  • 1900s: Hàng không, phân bón tổng hợp, bóng bán dẫn (transistor)
  • Cuối thế kỷ 20 đến 2000: Máy tính cá nhân (PC), Internet, điện thoại thông minh, điện toán đám mây

Nhận định:

  • Các đổi mới công nghệ có vẻ như trùng với các điểm bùng nổ trong tăng trưởng GDP.
  • Tăng trưởng GDP đặc biệt nhanh sau Cách mạng Công nghiệp, và tăng mạnh hơn nữa từ giữa thế kỷ 20 nhờ công nghệ điện toán và số hóa.

Biểu đồ này cho thấy sản lượng kinh tế toàn cầu đã tăng vọt theo thời gian, đặc biệt nhờ vào sự phát triển của công nghệ, nhất là trong vài thế kỷ gần đây.

📈

ⓑ. AI = Nhiều năm chuẩn bị trước khi cất cánh

Nguồn: snapshot slide #29

“Dòng thời gian các cột mốc AI – 1950–2022, theo Đại học Stanford …”

Biểu đồ thể hiện các sự kiện và bước đột phá quan trọng trong sự phát triển của trí tuệ nhân tạo (AI) trong hơn bảy thập kỷ, được sắp xếp theo thứ tự thời gian từ năm 1950 đến 2022.


Các điểm nổi bật trong dòng thời gian:

1950–1960: Giai đoạn nền tảng

  • 10/50: Alan Turing đề xuất Bài kiểm tra Turing để đo lường trí thông minh của máy tính.
  • 6/56: John McCarthy (ĐH Stanford) đặt ra thuật ngữ "Trí tuệ nhân tạo" (Artificial Intelligence) tại Hội nghị Dartmouth.
  • 1/62: Arthur Samuel (IBM) tạo ra chương trình tự học chơi cờ caro có thể đánh bại nhà vô địch Mỹ.
  • 1/66: Các nhà nghiên cứu Stanford phát triển Shakey, robot di động đa năng đầu tiên có khả năng suy luận về hành động của mình.

1967–1996: “Mùa đông AI” (AI ‘Winter’)

  • Giai đoạn tài trợ và kỳ vọng dành cho AI suy giảm do không đạt được các mục tiêu như mong đợi.
    (AI ‘Winter’ là thuật ngữ được Nils J. Nilsson, Giáo sư Kỹ thuật Kumagai về khoa học máy tính tại Đại học Stanford, sử dụng để mô tả giai đoạn AI tiếp tục đạt được tiến bộ về mặt khái niệm nhưng không có thành công thực tế đáng kể nào. Điều này dẫn đến AI không được mấy quan tâm và rất ít tài trợ dành cho AI.)

1997–2010: Đột phá và tái khởi động

  • 5/1997: Máy chơi cờ Deep Blue của IBM đánh bại nhà vô địch thế giới Garry Kasparov.
  • 10/2005: Xe tự lái Stanley của ĐH Stanford chiến thắng thử thách DARPA Grand Challenge sau khi hoàn thành chặng đường 132 dặm.
  • 9/2002: Roomba, robot hút bụi tự động thương mại đầu tiên có khả năng điều hướng trong nhà, được ra mắt.
  • 4/2010: Apple mua lại Siri, trợ lý giọng nói, và tích hợp vào iPhone 4S sau đó một năm.

2014–2022: Sự trỗi dậy của AI đàm thoại & mô hình ngôn ngữ lớn (LLM)

  • 6/2014: Chatbot Eugene Goostman vượt qua bài kiểm tra Turing khi 1/3 giám khảo tin rằng đó là con người.
  • 6/2018: OpenAI ra mắt GPT-1, mô hình ngôn ngữ lớn đầu tiên của họ.
  • 6/2020: OpenAI phát hành GPT-3; Microsoft độc quyền sử dụng.
  • 11/2022: OpenAI ra mắt ChatGPT cho công chúng.

Tóm tắt:

Dòng thời gian này phản ánh hành trình phát triển của AI từ nền tảng lý thuyết (Bài kiểm tra Turing), qua thời kỳ robot sơ khai (Shakey), các cuộc thi nổi bật (Deep Blue, DARPA), đến các ứng dụng thực tiễn (Roomba, Siri) và sự bùng nổ của mô hình ngôn ngữ lớn (LLM), đỉnh điểm là sự ra mắt công chúng của ChatGPT. Biểu đồ cũng cho thấy sự phát triển có tính chu kỳ của AI, bao gồm cả "mùa đông AI", trước khi bùng nổ mạnh mẽ trong thế kỷ 21.

Nguồn: snapshot slide #30

“… Dòng thời gian các cột mốc AI – 2023–2025, theo Đại học Stanford”

Biểu đồ mô tả các bước phát triển chính của trí tuệ nhân tạo xảy ra trong khoảng thời gian từ tháng 3/2023 đến tháng 4/2025. Dòng thời gian này làm nổi bật các đột phá kỹ thuật, sản phẩm mới, chính sách quốc tế, và việc ứng dụng AI bởi các công ty công nghệ lớn và chính phủ.


Các sự kiện chính theo mốc thời gian:

Tháng 3/2023

  • OpenAI ra mắt GPT-4: Mô hình đa phương thức có thể xử lý cả văn bản và hình ảnh.
  • Google phát hành Bard: Một đối thủ cạnh tranh trực tiếp với ChatGPT.
  • Microsoft tích hợp Copilot vào bộ ứng dụng Microsoft 365.
  • Anthropic giới thiệu Claude: Trợ lý AI tập trung vào tính an toàn và khả năng giải thích.

Tháng 3/2024

  • Bộ An ninh Nội địa Hoa Kỳ công bố Chiến lược lộ trình quốc gia về AI.

Tháng 11/2023

  • 28 quốc gia, bao gồm Mỹ, EU và Trung Quốc, ký Tuyên bố Bletchley về “An toàn AI”.

Tháng 4/2024

  • Meta phát hành LLaMA 3 (70 tỷ tham số): Một mô hình mã nguồn mở mạnh mẽ.

Tháng 5/2024

  • Google tích hợp AI để nâng cấp khả năng tìm kiếm.
  • OpenAI ra mắt GPT-4o: Mô hình đa phương thức đầy đủ (văn bản, hình ảnh, âm thanh).

Tháng 7/2024

  • Apple công bố “Apple Intelligence”: Hệ thống AI tích hợp vào thiết bị Apple, dành cho các nhà phát triển.

Tháng 9/2024

  • Alibaba phát hành bộ mô hình mã nguồn mở Qwen 2.5 (100 mô hình), có hiệu suất ngang bằng với các đối thủ phương Tây.

Tháng 12/2024

  • OpenAI công bố o3: Mô hình mạnh nhất từ trước đến nay của họ.

Tháng 1/2025

  • DeepSeek phát hành R1 và R1-Zero: Các mô hình suy luận mã nguồn mở.
  • Alibaba ra mắt Qwen 2.5-Max: Vượt qua GPT-4o và Claude 3.5 trong một số bài kiểm tra suy luận.

Tháng 2/2025

  • OpenAI ra mắt GPT-4.5
  • Anthropic phát hành Claude 3.7 Sonnet
  • xAI (của Elon Musk) tung ra Grok 3

Tháng 4/2025

  • ChatGPT đạt mốc 800 triệu người dùng hàng tuần

Tóm tắt:

Dòng thời gian này phản ánh sự tăng tốc mạnh mẽ trong đổi mới và triển khai AI từ 2023–2025, với các xu hướng nổi bật:

  • Sự phát triển nhanh chóng của các mô hình đa phương thức (GPT-4o, Claude, Grok 3)
  • Gia tăng đóng góp mã nguồn mở (LLaMA 3, Qwen 2.5)
  • Tích hợp AI sâu rộng vào sản phẩm công nghệ tiêu dùng (Apple Intelligence, Microsoft Copilot)
  • Hợp tác toàn cầu về an toàn AI
  • Sự bùng nổ người dùng trên các nền tảng AI như ChatGPT

Nội dung thể hiện rằng AI đang chuyển mình từ giai đoạn thử nghiệm sang trở thành nền tảng chiến lược chính trong công nghệ và xã hội.

📈

ⓒ. AI = Khoảng quý 2 năm 2025

Nguồn: snapshot slide #32

10 điều mà ChatGPT-4o có thể làm (vào thời điểm hiện nay):

  1. Viết hoặc chỉnh sửa bất kỳ nội dung nào
    Viết hoặc sửa email, bài luận, hợp đồng, thơ, mã lập trình — một cách trôi chảy và tức thì.
  2. Tóm tắt và giải thích tài liệu phức tạp
    Đơn giản hóa các tệp PDF, tài liệu pháp lý, nghiên cứu hoặc giải thích mã lập trình bằng tiếng Anh dễ hiểu.
  3. Dạy kèm bạn hầu như mọi môn học
    Giúp học toán, lịch sử, ngôn ngữ, hoặc ôn luyện kiểm tra theo từng bước một.
  4. Trở thành đối tác tư duy của bạn
    Hỗ trợ đưa ra ý tưởng tức thì, gỡ lỗi hoặc kiểm thử các giả định.
  5. Tự động hóa công việc lặp đi lặp lại
    Tạo báo cáo, làm sạch dữ liệu, tạo dàn ý, viết lại văn bản.
  6. Đóng vai bất kỳ ai bạn cần
    Luyện phỏng vấn, mô phỏng khách hàng hoặc tập dượt hội thoại.
  7. Kết nối bạn với các công cụ (máy tính)
    Viết mã cho API, bảng tính, lịch, hoặc các công cụ web.
  8. Cung cấp hỗ trợ tinh thần và đồng hành
    Trò chuyện hàng ngày với bạn, giúp bạn nhìn nhận lại vấn đề, hoặc chỉ đơn giản là lắng nghe bạn.
  9. Giúp bạn tìm ra mục tiêu sống
    Làm rõ giá trị cá nhân, xác định mục tiêu và lập kế hoạch hành động có ý nghĩa.
  10. Tổ chức cuộc sống của bạn
    Lập kế hoạch du lịch, xây dựng thói quen, sắp xếp lịch trình hoặc quy trình làm việc.

Có thể thấy tính đa dụng và linh hoạt của AI, đặc biệt là ChatGPT-4o, trong cả công việc chuyên môn và đời sống cá nhân. Nó nhấn mạnh rằng AI không chỉ giúp viết và lập trình, mà còn hỗ trợ cảm xúc, lập kế hoạch và học tập.

📈

ⓓ. AI = Khoảng năm 2030

Nguồn: snapshot slide #34

Mười điều AI có thể làm trong 5 năm tới:

  1. Tạo văn bản, mã lập trình và logic ở cấp độ con người
    Ứng dụng: Chatbot, lập trình phần mềm, lập kế hoạch kinh doanh, phân tích pháp lý.
  2. Sáng tạo phim và trò chơi dài tập
    Bao gồm: Viết kịch bản, tạo nhân vật, cảnh quay, cơ chế gameplay, lồng tiếng.
  3. Hiểu và nói như con người
    Trợ lý (ảo) có nhận thức cảm xúc, hỗ trợ đa ngôn ngữ theo thời gian thực.
  4. Vận hành trợ lý cá nhân nâng cao
    Lập kế hoạch cuộc sống, ghi nhớ thông tin, điều phối ứng dụng và thiết bị.
  5. Điều khiển robot giống con người
    Hỗ trợ việc nhà, chăm sóc người già, tự động hóa trong bán lẻ và khách sạn.
  6. Vận hành dịch vụ khách hàng & bán hàng tự động
    Xử lý trọn gói từ A-Z, bán kèm, tích hợp hệ thống CRM, hỗ trợ 24/7.
  7. Cá nhân hóa toàn bộ cuộc sống kỹ thuật số
    Học tập thích nghi, chọn lọc nội dung thông minh, huấn luyện sức khỏe cá nhân hóa.
  8. Xây dựng và vận hành doanh nghiệp tự động
    Doanh nghiệp do AI điều hành: quản lý tồn kho, định giá, vận hành kỹ thuật số toàn phần.
  9. Tiến hành khám phá khoa học một cách tự động
    Thiết kế thuốc, tổng hợp vật liệu, mô hình khí hậu, kiểm chứng giả thuyết mới.
  10. Hợp tác sáng tạo như một đối tác
    Đồng sáng tác tiểu thuyết, sản xuất âm nhạc, thiết kế thời trang, kiến trúc.

Dự báo này cho thấy AI sẽ phát triển vượt xa vai trò của một công cụ, trở thành đối tác sáng tạo, trợ lý thông minh, nhà phát minh, và thậm chí là doanh nhân tự động, đóng góp vào nhiều lĩnh vực như y tế, khoa học, kinh doanh, nghệ thuật sáng tạo và robot.

📈

ⓔ. AI = Khoảng năm 2035

Nguồn: snapshot slide #36

Mười điều AI có thể làm trong 10 năm tới:

  1. Thực hiện nghiên cứu khoa học
    Đưa ra giả thuyết, chạy mô phỏng, thiết kế và phân tích các thí nghiệm.
  2. Thiết kế các công nghệ tiên tiến
    Khám phá vật liệu mới, kỹ thuật công nghệ sinh học, và tạo nguyên mẫu hệ thống năng lượng.
  3. Mô phỏng tâm trí giống con người
    Tạo ra nhân dạng kỹ thuật số có trí nhớ, cảm xúc và hành vi thích nghi.
  4. Vận hành các công ty tự động
    Quản lý nghiên cứu & phát triển, tài chính, và hậu cần mà không cần nhiều sự can thiệp của con người.
  5. Thực hiện các nhiệm vụ vật lý phức tạp
    Sử dụng công cụ, lắp ráp linh kiện, và thích ứng trong môi trường thực tế.
  6. Phối hợp các hệ thống toàn cầu
    Tối ưu hóa hậu cần, tiêu thụ năng lượng, và phản ứng với khủng hoảng ở quy mô toàn cầu.
  7. Mô hình hóa toàn bộ hệ sinh học
    Mô phỏng tế bào, gen và sinh vật để phục vụ nghiên cứu và trị liệu.
  8. Đưa ra quyết định ở cấp độ chuyên gia
    Cung cấp lời khuyên pháp lý, y tế và kinh doanh theo thời gian thực.
  9. Định hình các cuộc tranh luận và chính sách công
    Điều hành diễn đàn, đề xuất luật pháp, và cân bằng các lợi ích đối lập.
  10. Xây dựng thế giới ảo sống động
    Tạo ra môi trường 3D tương tác trực tiếp từ các yêu cầu bằng văn bản.

Dự báo này phác họa một tương lai mà ở đó AI vượt xa vai trò hỗ trợ công việc thông thường. AI sẽ tham gia vào các hoạt động cốt lõi của khám phá khoa học, tự động hóa toàn bộ doanh nghiệp, mô phỏng trí óc con người, điều hành hệ thống toàn cầu và góp phần định hình chính sách công. Việc AI tích hợp sâu vào cả thế giới vật lý lẫn kỹ thuật số cho thấy tiềm năng thay đổi mạnh mẽ phương thức vận hành xã hội.

📈

ⓕ. Xu hướng phát triển AI = Chưa từng có tiền lệ

Nguồn: snapshot slide #38

 “Các mô hình học máy nổi bật toàn cầu theo lĩnh vực – 2003–2024, theo Stanford HAI” là một biểu đồ đường, minh họa số lượng mô hình học máy mới nổi bật được phát triển hàng năm từ năm 2003 đến 2024, được phân loại theo ngành hoặc hình thức hợp tác phát triển.


Những điểm nổi bật:

Trục tung (Y-axis):

  • Số lượng mô hình học máy nổi bật mới hàng năm” – từ 0 đến hơn 60.

Trục hoành (X-axis):

  • Từ năm 2003 đến 2024.

Hai giai đoạn rõ rệt được xác định:

Giai đoạn 2003–2014: Kỷ nguyên Học thuật (Academia Era)

  • Được khoanh bằng khung đứt nét màu đỏ.
  • Phần lớn mô hình nổi bật do các viện nghiên cứu và trường đại học phát triển.
  • Số lượng mỗi năm dao động khoảng 0–15 mô hình.
  • Đường màu chủ đạo: xanh đậm, đại diện cho giới học thuật.

Giai đoạn 2015 đến nay: Kỷ nguyên Công nghiệp (Industry Era)

  • Được đánh dấu bằng khung đứt nét màu xanh lá.
  • Có sự chuyển dịch rõ rệt: ngành công nghiệp trở thành lực lượng dẫn đầu.
  • Sản lượng mô hình tăng vọt, đạt hơn 60 mô hình/năm vào 2023.
  • Đường màu chủ đạo: tím nhạt, đại diện cho ngành công nghiệp.
  • Có sự gia tăng của mô hình hợp tác, đặc biệt giữa công nghiệp – học thuật (màu xanh dương nhạt) và công nghiệp – chính phủ (màu xanh lá cây).

Các đường biểu diễn theo lĩnh vực (Màu & Chú thích):

  • Công nghiệp (Industry – tím nhạt): Tăng mạnh sau 2015, chiếm ưu thế vào các năm gần đây (đỉnh là 55 mô hình vào 2023).
  • Học thuật (Academia – xanh đậm): Tăng vừa phải, giảm mạnh sau 2014.
  • Hợp tác Công nghiệp – Học thuật (xanh dương nhạt): Bắt đầu tăng sau 2015.
  • Công nghiệp – Chính phủ (xanh lá cây): Có mặt vào năm 2024, quy mô nhỏ.
  • Khác (tập thể nghiên cứu, các hình thức hợp tác khác): Gần như không đổi, đóng góp rất ít.

Nhận định:

  • Có sự chuyển giao rõ rệt từ giới học thuật sang khối doanh nghiệp trong lĩnh vực phát triển học máy.
  • Các mô hình hợp tác giữa các bên tuy gia tăng nhưng vẫn ít hơn so với các mô hình thuần túy do doanh nghiệp dẫn đầu.
  • Biểu đồ cho thấy rằng từ năm 2015, học máy đã trở thành lĩnh vực do ngành công nghiệp chi phối.

-

Tăng trưởng số lượng nhà phát triển AI (Hệ sinh thái NVIDIA làm đại diện) = Tăng gấp 6 lần, đạt 6 triệu nhà phát triển trong bảy năm.

Ước tính số lượng nhà phát triển toàn cầu trong Hệ sinh thái Google  – Từ tháng 5/2024 khoảng 1,44 triệu người đến tháng 5/2025 đật khoảng 7 triệu người, Theo Google.

Nguồn: snapshot slide #43

 

Mục đích của biểu đồ:

Đây là một biểu đồ cột ngang thể hiện tỷ lệ người thử nghiệm nhầm lẫn câu trả lời do AI tạo ra là do con người viết, dựa trên nghiên cứu của Cameron Jones và Benjamin Bergen. Biểu đồ so sánh nhiều hệ thống AI khác nhau về mức độ giống con người trong phản hồi của chúng.


Chỉ số thể hiện:

“% người thử nghiệm nhầm lẫn câu trả lời AI là do con người viết”
→ Còn gọi là Tỷ lệ thắng của AI (AI Win Rate).


Các hệ thống AI được so sánh:

Hệ thống AI

Ngày phát hành

Đặc điểm

Màu sắc cột

Hiệu suất

GPT-4o

05/2024

Không có persona

Màu xanh lá

Dưới 50%

ELIZA

01/2025

Chatbot đời đầu (mốc tham chiếu)

Màu xám

Rất thấp

GPT-4.5

02/2025

Có persona

Màu tím

~73% (Vượt qua người thật)


Chi tiết trực quan chính:

  • Trục hoành (x) thể hiện tỷ lệ thắng của AI (tức là tỷ lệ người dùng nhầm tưởng phản hồi của AI là của con người).
  • Một vùng được tô bóng hiển thị “Tỷ lệ thắng của con người” quanh mốc 50%, được dùng làm tiêu chuẩn tham chiếu.
  • GPT-4.5 vượt trội rõ rệt với cột kéo dài qua mốc 70%, nghĩa là hơn 70% câu trả lời bị nhầm là do người viết.
  • GPT-4o có tỷ lệ khiêm tốn hơn, dưới mốc con người.
  • ELIZA có tỷ lệ rất thấp, nhấn mạnh tính lịch sử và đơn giản của nó.
  • Các thanh ngang nhỏ biểu thị khoảng sai số hoặc mức độ tin cậy của số liệu.
  • Một khung xanh chấm gạch bao quanh GPT-4.5 để nhấn mạnh hiệu suất vượt trội của nó.

Ghi chú ở phía dưới:

  • Hộp văn bản ghi: "Hiệu suất của hệ thống AI liên tục được cải thiện theo thời gian" – ngụ ý rằng AI ngày càng trở nên giống con người hơn trong ngôn ngữ và hành vi.

Kết luận:

  • AI đang nhanh chóng thu hẹp khoảng cách với khả năng giao tiếp như con người.
  • Tính đến quý 1 năm 2025, GPT-4.5 (có persona) đã bị nhầm là con người trong 73% trường hợp, cho thấy một bước tiến lớn trong khả năng mô phỏng ngôn ngữ và tư duy tự nhiên.

📈

🤔. Suy ngẫm chậm

Ngoài bài Trends – Artificial Intelligence của BOND, cộng đồng AI/ML có nhiều trang khảo sát thường niên. Đáng chú ý có trang AI index (chỉ số AI) của đại học Stanford, xuất bản hàng năm kể từ năm 2017. Chỉ số AI năm 2025 ở đây: The 2025 AI Index Report. Báo cáo này có vẻ hàn lâm trong lúc báo cáo của BOND hấp dẫn hơn đối với “thường dân” và đặc biệt là giới kinh doanh.

Trích dẫn mà tôi thích nhất trong bài của BOND là:

Knowledge is a process of piling up facts; wisdom lies in their simplification.

Martin H. Fischer, German-born American Physician / Teacher / Author (1879-1962)

(slide #27)

Tạm dịch:

Kiến thức là quá trình tích lũy các dữ kiện; trí tuệ nằm ở sự đơn giản hóa chúng.

Martin H. Fischer, Bác sĩ / Giáo viên / Tác giả người Mỹ gốc Đức (1879-1962)

-

Trân trọng & vui nhã

(_/)
( •_•)
/ >

LeVanLoi



2025/06/15

☕ Nhàn đàm ICT: Drone ✈️

Phác họa bài post:

. Đề dẫn.

. Kiến trúc tổng quát của drone.

. Tích hợp AI/ML vào drone.

. Thị trường drone.

. Suy ngẫm chậm.

~

Để giúp anh/chị quyết định có đọc tiếp hay không, tôi xin phép cung cấp các thông tin liên quan đến bài post này như sau:

·       Chủ đề: ICT thường thức & Machine Learning

·       Tính thời sự: tháng 5/2025

·       Thời gian đọc: 12 phút, kể cả thời gian uống cà phê (uống cà phê xong là đọc xong)

. Đề dẫn.

Chủ đề lần này tôi chọn là “Drone”. Đây là một cách viết khác của UAV (Unmanned Aerial Vehicle - Phương tiện bay không người lái). Drone/UAV là tên gọi chung cho các phương tiện bay không có người điều khiển ở trên phương tiện, hoạt động một cách tự lập thông qua các phương pháp điều khiển như: tự động theo chương trình cài đặt sẵn; điều khiển từ xa bởi trung tâm / máy điều khiển; hoặc hỗn hợp: vừa tự động vừa điều khiển từ xa.

Drone ban đầu được sử dụng cho những nhiệm vụ quá “tốn kém, hoặc nguy hiểm” với con người. Mặc dầu chúng khởi đầu chủ yếu từ ứng dụng quân sự, hiện nay được mở rộng nhanh chóng sang thương mại, khoa học, giải trí, nông nghiệp và các ứng dụng khác, như giám sát và an ninh, giao hàng, chụp ảnh trên không, kiểm tra cơ sở hạ tầng, …

Vậy nên, mời anh/chị chúng ta cùng tò mò xem lướt qua:

·       chúng có kiến trúc như thế nào (.),

·       chúng được tích hợp AI/ML ra sao (.) và

·       cuối cùng, mời anh/chị cùng “khảo sát” thị trường drone (.).

-

Dữ liệu trong bài post này không có các tham chiếu cụ thể (tôi tìm kiếm trên Internet phối hợp sử dụng chatbot). Nếu có các nhận định thì đó là do chủ quan của cá nhân. Tóm lại, đây chỉ là bài đàm luận để giải trí đơn thuần, không có gì là “hàn lâm” cả. 😊

. Kiến trúc tổng quát của drone.

Kiến trúc drone là hệ thống phức tạp bao gồm nhiều thành phần tích hợp hoạt động phối hợp với nhau để cho phép bay tự động hoặc điều khiển từ xa và thực hiện các nhiệm vụ cụ thể. Mặc dù các thiết kế rất đa dạng tùy thuộc vào kích thước, mục đích và độ tinh vi của drone, kiến trúc chung của chúng gồm một số phân hệ chính như sau:


Nguồn: https://upload.wikimedia.org/wikipedia/commons/5/5d/UAV_Physical_and_hardware.jpg


1. Khung máy bay

  • Mục đích: Cấu trúc vật lý chứa tất cả các thành phần khác và cung cấp hình dạng khí động học cần thiết cho chuyến bay.
  • Vật liệu: Thường nhẹ nhưng chắc chắn, chẳng hạn như sợi carbon, nhựa, nhôm hoặc vật liệu tổng hợp.
  • Các loại:
    • Đa cánh quạt (Multi-rotor): (ví dụ: quadcopter, hexacopter) Đặc trưng bởi nhiều cánh quạt để cất cánh và hạ cánh thẳng đứng (VTOL: vertical take-off and landing), bay lơ lửng và cơ động. Phổ biến cho các loại drone thương mại và tiêu dùng.
    • Cánh cố định (Fixed-wing): Giống như máy bay truyền thống, dựa vào cánh để tạo lực nâng. Cung cấp độ bền và tầm bay dài hơn, phù hợp cho giám sát, lập bản đồ và giao hàng trên quãng đường dài.
    • Hybrid (VTOL cánh cố định): Kết hợp các tính năng của cả hai loại, cho phép cất cánh/hạ cánh thẳng đứng và bay tiến hiệu quả.

2. Hệ thống đẩy (Propulsion System)

  • Mục đích: Tạo ra lực đẩy cần thiết cho chuyến bay.
  • Các thành phần:
    • Động cơ: Internal Combustion Engines
      • Động cơ điện (Động cơ DC không chổi than – BLDC: Brushless DC motors): Phổ biến nhất cho các loại drone cỡ nhỏ đến trung bình do hiệu suất cao, hoạt động êm ái và dễ điều khiển.
      • Động cơ đốt trong (Internal Combustion Engines): Được sử dụng trong các UAV quân sự hoặc công nghiệp lớn hơn, có độ bền cao để tăng công suất và tầm bay (ví dụ: xăng, nhiên liệu nặng).
      • Động cơ phản lực (Jet Engines): UAV cấp quân sự tốc độ rất cao.
    • Cánh quạt/Rotor: Các cánh tạo ra lực đẩy từ vòng quay của động cơ. Drone đa cánh quạt có nhiều cánh quạt, trong khi drone cánh cố định có một hoặc nhiều cánh quạt.
    • Bộ điều khiển tốc độ điện tử (ESC: Electronic Speed Controller): Điều chỉnh tốc độ và hướng của từng động cơ dựa trên lệnh từ bộ điều khiển chuyến bay. Rất quan trọng cho sự ổn định và khả năng cơ động.

3. Hệ thống nguồn năng lượng (Power System)

  • Mục đích: Cung cấp năng lượng điện cho tất cả các thành phần trên bo mạch.
  • Các thành phần:
    • Pin:
      • Pin Lithium Polymer (LiPo): Phổ biến nhất cho drone điện do mật độ năng lượng và công suất đầu ra cao.
      • Pin nhiên liệu hydro: Đang nổi lên cho các ứng dụng yêu cầu độ bền cao hơn do mật độ năng lượng cao hơn.
    • Bảng phân phối điện (PDB: Power Distribution Board): Phân phối điện từ pin đến các thành phần khác nhau.
    • Bộ điều chỉnh điện áp: Đảm bảo nguồn điện áp ổn định cho các thiết bị điện tử nhạy cảm.

4. Hệ thống điều khiển bay (FCS: Flight Control System) / Lái tự động (Autopilot)

  • Mục đích: "Bộ não" của UAV, chịu trách nhiệm ổn định máy bay, thực hiện các lệnh bay và cho phép bay tự động.
  • Các thành phần:
    • Bảng điều khiển bay (FC: Flight Controller): Một bộ vi điều khiển (MCU) xử lý dữ liệu từ cảm biến, thực hiện các thuật toán điều khiển và gửi lệnh đến ESC (bộ điều khiển tốc độ) và các bộ truyền động khác. Ví dụ bao gồm Pixhawk, ArduPilot, Betaflight.
    • Thiết bị đo lường quán tính (IMU: Inertial Measurement Unit): Chứa gia tốc kế (đo gia tốc), con quay hồi chuyển (đo vận tốc góc) và thường là từ kế (la bàn điện tử). Cung cấp thông tin về hướng, tốc độ góc và gia tốc tuyến tính của UAV.
    • Áp kế (Barometer): Đo áp suất khí quyển để xác định độ cao.
    • Mô-đun GPS: Cung cấp định vị toàn cầu chính xác (vĩ độ, kinh độ, độ cao) và thông tin vận tốc. Các mô-đun GPS RTK/PPK cung cấp độ chính xác cao hơn.
    • Phần mềm/Firmware: Chạy trên FC (điều khiển bay), thực hiện các thuật toán điều khiển bay (ví dụ: bộ điều khiển PID), các quy trình điều hướng, giao thức an toàn và giao thức liên lạc.

5. Hệ thống điều hướng và truyền tin (Navigation and Communication System)

  • Mục đích: Cho phép UAV biết vị trí của nó, đi theo một lộ trình và giao tiếp với trạm điều khiển mặt đất (GCS: ground control station) và/hoặc các UAV khác.
  • Các thành phần:
    • GPS/GNSS: (như đã đề cập trong FCS) Cần thiết cho điều hướng ngoài trời và theo dõi điểm dừng.
    • Mô-đun Telemetry: Tạo điều kiện giao tiếp hai chiều giữa UAV và GCS, truyền dữ liệu chuyến bay (độ cao, tốc độ, pin, v.v.) và nhận lệnh.
    • Bộ thu sóng điều khiển từ xa (RC Receiver): Nhận các lệnh điều khiển thủ công từ bộ phát của người điều khiển từ xa.
    • Hệ thống truyền video (VTX/VRX):
      • VTX (Bộ phát): Gửi nguồn cấp dữ liệu video trực tiếp từ camera trên bo mạch xuống mặt đất.
      • VRX (Bộ thu): Nhận nguồn cấp dữ liệu video trên mặt đất (ví dụ: kính FPV, màn hình).
    • Ăng-ten: Dành cho tất cả các liên kết liên lạc (RC, telemetry, video).
    • Hệ thống liên lạc nâng cao: Đối với các hoạt động tầm xa hoặc BVLOS (Ngoài tầm nhìn thẳng), có thể bao gồm mạng di động (4G/5G), liên lạc vệ tinh (SATCOM) hoặc công nghệ mạng lưới.

6. Tải trọng (Payload)

  • Mục đích: Thiết bị cụ thể được UAV mang theo để thực hiện các nhiệm vụ chuyên biệt của nó. Điều này thay đổi rất nhiều tùy thuộc vào ứng dụng.
  • Ví dụ:
    • Camera: Camera RGB, đa phổ, siêu phổ, camera nhiệt để chụp ảnh, quay video, lập bản đồ, kiểm tra.
    • Cảm biến Lidar: Để lập bản đồ 3D, khảo sát và tránh chướng ngại vật.
      (LiDAR là viết tắt của Light Detection and Ranging. Đây là công nghệ cảm biến từ xa sử dụng xung laser để đo khoảng cách và tạo ra mô hình 3D chi tiết của vật thể hoặc môi trường.)
    • Các cảm biến khác: Cảm biến khí, máy dò bức xạ, cảm biến khí tượng, v.v.
    • Cơ chế giao hàng: Hệ thống thả hàng cho các gói hàng, vật tư y tế hoặc các tải trọng khác.
    • Gimbal: Bộ phận gắn kết ổn định cho camera và các cảm biến khác để giữ chúng cân bằng và ổn định trong suốt chuyến bay, bù đắp cho chuyển động của drone.
    • Bộ thao tác/Cánh tay: Cho các tác vụ chuyên biệt như nhặt đồ vật hoặc thực hiện sửa chữa.

7. Trạm điều khiển mặt đất (GCS: Ground Control Station)

  • Mục đích: Giao diện từ đó các nhà vận hành giám sát và điều khiển UAV.
  • Các thành phần:
    • Bộ điều khiển từ xa/Bộ phát: Thiết bị cầm tay với cần điều khiển và các nút để điều khiển chuyến bay thủ công.
    • Máy tính/Máy tính bảng: Chạy phần mềm GCS chuyên dụng (ví dụ: Mission Planner, QGroundControl) để lập kế hoạch nhiệm vụ, hiển thị dữ liệu telemetry thời gian thực, nguồn cấp dữ liệu video và gửi lệnh.
    • Ăng-ten: Để liên lạc với UAV.

8. Các tính năng nâng cao (tùy thuộc vào độ tinh vi)

  • Hệ thống tránh chướng ngại vật: Sử dụng cảm biến thị giác, cảm biến siêu âm hoặc lidar để phát hiện và tránh chướng ngại vật một cách tự động.
  • Xử lý thị giác máy tính/AI: Khả năng tính toán trên bo mạch để xử lý hình ảnh, phát hiện đối tượng, nhận dạng và điều hướng tự hành nâng cao theo thời gian thực.
  • Hệ thống dự phòng: Nhiều bộ điều khiển chuyến bay, mô-đun GPS hoặc hệ thống năng lượng để tăng độ tin cậy và an toàn trong các ứng dụng quan trọng.
  • Lưu trữ dữ liệu: Thẻ SD hoặc bộ nhớ trong để ghi lại dữ liệu chuyến bay và dữ liệu tải trọng (ví dụ: hình ảnh, video).

⚠️       Đây chỉ là kiến trúc chung cho tất cả các loại drone. Việc triển khai và độ phức tạp cụ thể của từng thành phần có thể rất khác nhau trong các trường hợp như drone đồ chơi, drone điện ảnh chuyên nghiệp hay UAV trinh sát cấp quân sự.

-

. Tích hợp AI/ML vào drone.

Việc tích hợp Trí tuệ nhân tạo (AI) và Học máy (ML) vào UAV biến chúng từ những thiết bị điều khiển từ xa tinh vi thành các hệ thống thông minh, tự hành và có khả năng cao. Sự tích hợp này giúp nâng cao đáng kể khả năng nhận thức, hiểu và tương tác với môi trường, dẫn đến hiệu suất được cải thiện trong nhiều ứng dụng khác nhau.

Dưới đây là phương thức chung AI và ML được tích hợp vào các thiết bị UAV:


1. Xử lý trên thiết bị (AI biên - Edge AI)

Đây là cách trực tiếp và quan trọng nhất để tích hợp AI: bao gồm việc đặt phần cứng chuyên dụng và chạy các mô hình ML trực tiếp trên chính drone.

  • Bộ xử lý AI chuyên dụng: UAV ngày càng được trang bị phần cứng chuyên dụng như:
    • GPU (Graphics Processing Units): Tuyệt vời cho xử lý song song, lý tưởng cho các mô hình deep learning, đặc biệt là các tác vụ thị giác máy tính. Dòng NVIDIA Jetson (ví dụ: Jetson Nano, Xavier NX) phổ biến cho AI biên trong drone.
    • NPU (Neural Processing Units): Được thiết kế đặc biệt để tăng tốc các phép tính mạng nơ-ron, mang lại hiệu quả cao cho suy luận (chạy các mô hình đã được huấn luyện).
    • FPGA (Field-Programmable Gate Arrays): Cung cấp sự linh hoạt để thiết kế logic phần cứng tùy chỉnh cho các tác vụ AI cụ thể, mang lại độ trễ thấp và hiệu suất cao.
  • Điện toán biên (Edge Computing): Xử lý dữ liệu gần nguồn (trên drone) giúp giảm thiểu độ trễ và giảm nhu cầu liên tục gửi lượng lớn dữ liệu thô đến máy chủ từ xa. Điều này rất quan trọng đối với việc ra quyết định theo thời gian thực, chẳng hạn như:
    • Tránh chướng ngại vật: Xử lý ngay lập tức dữ liệu cảm biến (từ camera, LiDAR, cảm biến siêu âm) để phát hiện chướng ngại vật và điều chỉnh đường bay trong vòng mili giây.
    • Điều hướng tự hành: Cho phép drone điều hướng trong môi trường phức tạp, ngay cả khi không có GPS, bằng cách thực hiện Định vị và Lập bản đồ đồng thời (SLAM: Simultaneous Localization and Mapping) trong thời gian thực.
    • Phát hiện và theo dõi đối tượng theo thời gian thực: Xác định và theo dõi các đối tượng cụ thể (người, phương tiện, động vật hoang dã) trong một tác vụ.

2. Hợp nhất cảm biến (Sensor Fusion) và Nhận thức (Perception)

Các thuật toán AI và ML là chìa khóa để kết hợp và diễn giải dữ liệu từ các cảm biến khác nhau nhằm tạo ra sự hiểu biết toàn diện về môi trường xung quanh UAV.

  • Tổng hợp dữ liệu: Các thuật toán hợp nhất dữ liệu từ:
    • Camera (RGB, Nhiệt, Đa phổ): Để thu thập thông tin trực quan, phát hiện đối tượng, phân loại hình ảnh và lập bản đồ.
    • LiDAR: Để lập bản đồ 3D chính xác, đo khoảng cách và tạo đám mây điểm dày đặc.
    • Radar: Để phát hiện chướng ngại vật tầm xa, đặc biệt trong điều kiện thời tiết khắc nghiệt.
    • Cảm biến siêu âm (Ultrasonic Sensors): Để phát hiện khoảng cách gần.
    • IMU (Inertial Measurement Unit) & GPS: Để xác định vị trí, hướng và vận tốc.
  • Các mô hình Machine Learning:
    • Thị giác máy tính (CV: Computer Vision): Các mô hình Deep Learning như Mạng nơ-ron tích chập (CNN: Convolutional Neural Networks) được huấn luyện để:
      • Nhận dạng/Phân loại đối tượng: Xác định và phân loại đối tượng (ví dụ: phân biệt giữa cây và tòa nhà, xác định các loại cây trồng cụ thể, nhận dạng hình dáng con người).
      • Phân vùng ảnh theo ngữ nghĩa (Semantic Segmentation): Phân loại cấp độ pixel để hiểu các vùng khác nhau của hình ảnh (ví dụ: đường, bầu trời, thảm thực vật).
      • Phát hiện dị thường: Phát hiện các mẫu hoặc khuyết tật bất thường (ví dụ: vết nứt trên cầu, rỉ sét trên đường ống, cây bị bệnh trên cánh đồng).
    • Thuật toán hợp nhất cảm biến (Sensor Fusion Algorithms): Bộ lọc Kalman, Mạng Bayes, hoặc các mạng nơ-ron tiên tiến hơn có thể kết hợp dữ liệu nhiễu từ nhiều cảm biến để cung cấp ước tính chính xác và chắc chắn hơn về trạng thái và môi trường của drone.

3. Điều hướng tự hành (Autonomous Navigation) và Lập kế hoạch đường bay (Path Planning)

AI/ML cho phép drone lập kế hoạch và thực hiện các nhiệm vụ phức tạp với sự can thiệp tối thiểu của con người.

  • Thuật toán lập kế hoạch đường bay:
    • Học tăng cường (RL: Reinforcement Learning): Drone có thể học các chính sách bay tối ưu thông qua mày mò (trial and error) trong môi trường mô phỏng hoặc thực tế, tối đa hóa phần thưởng (ví dụ: hiệu quả, an toàn). Điều này đặc biệt hữu ích để thích nghi với môi trường động.
    • Thuật toán dựa trên đồ thị (ví dụ: A, RRT):* Được sử dụng để tìm đường đi tối ưu hoặc gần tối ưu trong khi tránh các chướng ngại vật đã phát hiện.
    • Mạng nơ-ron: Có thể học cách tạo ra các đường bay hiệu quả và không va chạm dựa trên các đầu vào từ môi trường.
  • Điều khiển bay thích ứng (Adaptive Flight Control): Các mô hình ML có thể học cách điều chỉnh các tham số kiểm soát trong thời gian thực dựa trên các điều kiện môi trường thay đổi (gió, nhiễu loạn) hoặc các biến thể tải trọng, đảm bảo chuyến bay ổn định và hiệu quả.

4. Phân tích dữ liệu và Ra quyết định theo thời gian thực

Ngoài việc điều hướng, AI cho phép drone trích xuất thông tin chi tiết có thể hành động trực tiếp trong quá trình bay.

  • Phân tích trong chuyến bay: Đối với các ứng dụng như:
    • Nông nghiệp chính xác: Xác định cây trồng bị stress hoặc các khu vực cần nước/phân bón.
    • Kiểm tra cơ sở hạ tầng: Phát hiện và phân loại các khuyết tật (ví dụ: rỉ sét, vết nứt, bu lông lỏng) trên đường dây điện, cầu hoặc tua-bin gió.
    • Tìm kiếm và cứu nạn: Xác định con người hoặc các đối tượng cụ thể trong vùng thiên tai.
    • An ninh và Giám sát: Nhận dạng các vụ xâm nhập trái phép hoặc các hoạt động đáng ngờ.
  • Bảo trì dự đoán: Các thuật toán ML có thể phân tích dữ liệu đo từ xa chuyến bay, nhiệt độ động cơ, hiệu suất pin và các tham số khác để dự đoán lỗi linh kiện, cho phép bảo trì chủ động và giảm thời gian ngừng hoạt động.

5. Trí tuệ bầy đàn (Swarm Intelligence)

Việc tích hợp AI cho phép nhiều drone hoạt động cùng nhau một cách hợp tác.

  • Học tăng cường đa tác tử (MARL: Multi-Agent Reinforcement Learning): Drone học cách phối hợp hành động của chúng, chia sẻ thông tin và cùng nhau đạt được các mục tiêu phức tạp (ví dụ: lập bản đồ một khu vực rộng lớn nhanh hơn, thực hiện các màn trình diễn ánh sáng đồng bộ, tìm kiếm và cứu nạn hợp tác).
  • Điều khiển phi tập trung (Decentralized Control): AI cho phép từng drone trong một đàn đưa ra các quyết định cục bộ góp phần vào mục tiêu chung của đàn, giảm sự phụ thuộc vào một bộ điều khiển trung tâm duy nhất.

6. Quy trình huấn luyện và triển khai mô hình

  • Thu thập dữ liệu: Các tập dữ liệu lớn (hình ảnh, video, dữ liệu cảm biến, nhật ký chuyến bay) được thu thập từ drone hoặc mô phỏng.
  • Gán nhãn/Chú thích dữ liệu: Đối với học có giám sát, dữ liệu phải được gắn nhãn cẩn thận (ví dụ: vẽ hộp giới hạn xung quanh các đối tượng, phân đoạn hình ảnh).
  • Lựa chọn và phát triển mô hình: Chọn các mô hình ML phù hợp (CNN, RNN, Transformer, tác tử RL) và thiết kế kiến trúc của chúng.
  • Huấn luyện: Các mô hình được huấn luyện trên các máy chủ mạnh (thường là trên đám mây) bằng cách sử dụng dữ liệu đã thu thập.
  • Tối ưu hóa cho triển khai biên: Các mô hình đã được huấn luyện thường được nén, lượng tử hóa hoặc tối ưu hóa để chạy hiệu quả trên tài nguyên tính toán hạn chế của drone.
  • Tích hợp phần cứng: Mô hình được tối ưu hóa và công cụ suy luận cần thiết được triển khai lên bộ xử lý AI trên bo mạch của drone.
  • Kiểm thử và Xác thực (Testing & Validation): Thực hiện việc kiểm thử và xác thực dữ liệu một cách đầy đủ và toàn diện, bao gồm mô phỏng Phần cứng trong vòng lặp (HIL: Hardware-in-the-Loop) và thử nghiệm bay trong thế giới thực, là rất quan trọng để đảm bảo độ tin cậy, an toàn và hiệu suất.
  • Học liên tục/Cập nhật: Các mô hình có thể được cập nhật định kỳ và tái huấn luyện dựa trên dữ liệu mới hoặc phản hồi về hiệu suất (đôi khi sử dụng các kỹ thuật như federated learning).

Thách thức trong tích hợp AI/ML:

  • Hạn chế về tính toán: Drone có tải trọng, năng lượng và khả năng xử lý hạn chế. Điều này đòi hỏi các mô hình AI có hiệu suất cao và phần cứng được tối ưu hóa.
  • Tiêu thụ điện năng: Chạy các mô hình AI lớn tiêu thụ đáng kể điện năng, ảnh hưởng đến thời gian bay.
  • Kích thước dữ liệu và băng thông: Mặc dù xử lý biên có lợi, việc truyền các tập dữ liệu lớn để huấn luyện và cập nhật mô hình vẫn có thể là một thách thức.
  • Hiệu suất thời gian thực: Các quyết định của AI phải được đưa ra trong vòng mili giây cho các tác vụ quan trọng như tránh chướng ngại vật.
  • Tính chắc chắn (Robustness) và độ tin cậy: Các mô hình AI phải hoạt động đáng tin cậy trong các môi trường thế giới thực đa dạng, không thể đoán trước (ánh sáng thay đổi, thời tiết, các vật thể không mong muốn).
  • An toàn và chứng nhận (Safety and Certification): Đảm bảo an toàn và độ tin cậy của các hệ thống tự hành do AI điều khiển là phức tạp và rất quan trọng để được phê duyệt theo quy định.
  • Tính khả giải thích và mức tin cậy (Explainability and Trust): Có nhiều tình huống mô hình (AI) đưa ra một quyết định mà giới nghiên cứu vẫn chưa thể giải thích được. Đây là một mối lo ngại đối với các ứng dụng quan trọng.

Bằng cách vượt qua những thách thức nói trên, việc tích hợp AI và ML về cơ bản đã biến UAV thành các công cụ cực kỳ thông minh, tự hành và linh hoạt, có khả năng thực hiện các nhiệm vụ phức tạp với hiệu quả và an toàn chưa từng có trên nhiều ngành công nghiệp.

-

. Thị trường drone.

Thị trường UAV toàn cầu hiện đang trải qua sự tăng trưởng đáng kể và được dự báo sẽ tiếp tục mở rộng nhanh chóng trong những năm tới. Sự tăng trưởng này được thúc đẩy bởi những tiến bộ trong công nghệ, sự gia tăng các ứng dụng trên nhiều lĩnh vực khác nhau và nhu cầu ngày càng tăng trong cả lĩnh vực quân sự và thương mại.

Dưới đây là tổng quan về thị trường UAV thế giới hiện nay:


1. Quy mô thị trường và Dự báo

  • Quy mô hiện tại (2024): Quy mô thị trường UAV toàn cầu ước tính khoảng 36,04 tỷ USD đến 73,06 tỷ USD vào năm 2024, tùy thuộc vào nguồn báo cáo và phạm vi của nó (một số báo cáo phân biệt giữa thị trường UAV tổng thể và thị trường dịch vụ máy bay không người lái).
  • Tăng trưởng dự kiến: Thị trường dự kiến sẽ chứng kiến sự tăng trưởng đáng kể, với các dự báo khác nhau nhưng nhìn chung cho thấy Tốc độ tăng trưởng kép hàng năm (CAGR: Compound annual growth rate) mạnh mẽ.
    • Một số báo cáo dự báo thị trường sẽ đạt khoảng 47,67 tỷ USD vào năm 2032 với CAGR khoảng 15,35%.
    • Các ước tính khác cho thấy giá trị 163,60 tỷ USD vào năm 2030 với CAGR 14,3% từ năm 2025 đến năm 2030 (Grand View Research).
    • Các dự báo mạnh mẽ hơn cho thấy tiềm năng đạt 250,96 tỷ USD vào năm 2037 với CAGR trên 16,1% (Research Nester).
  • Thị trường dịch vụ UAV: Thị trường dịch vụ UAV cũng đang tăng trưởng đáng kể, với ước tính 24,56 tỷ USD vào năm 2024 và dự báo sẽ vượt 555,58 tỷ USD vào năm 2034 với CAGR 36,60% (Precedence Research). Điều này cho thấy sự nhấn mạnh ngày càng tăng vào việc thu thập, phân tích dữ liệu và các hoạt động chuyên biệt được thực hiện bởi máy bay không người lái.

2. Các yếu tố thúc đẩy thị trường chính

  • Ứng dụng trong Quân sự và Quốc phòng: Đây vẫn là phân khúc lớn nhất của thị trường UAV. Việc tăng chi tiêu quốc phòng toàn cầu, nỗ lực hiện đại hóa và tầm quan trọng chiến lược của UAV cho hoạt động tình báo, giám sát, trinh sát (ISR: intelligence, surveillance, reconnaissance), thu thập mục tiêu và các hoạt động chiến đấu là những động lực chính. Các quốc gia đang đầu tư mạnh vào việc nâng cấp UAV cấp quân sự để đảm bảo an ninh quốc gia.
  • Ứng dụng Thương mại: Lĩnh vực dân sự và thương mại đang có sự tăng trưởng nhanh chóng nhờ:
    • Nông nghiệp: Nông nghiệp chính xác (giám sát cây trồng, ước tính năng suất, phun thuốc).
    • Xây dựng: Lập bản đồ địa điểm, giám sát tiến độ, kiểm tra an toàn.
    • Hậu cần và Giao hàng: Dịch vụ giao hàng chặng cuối (ví dụ: Amazon, UPS, DHL), đặc biệt ở khu vực đô thị và khó tiếp cận.
    • An toàn và An ninh công cộng: Thực thi pháp luật, ứng phó khẩn cấp, hoạt động tìm kiếm và cứu nạn.
    • Kiểm tra cơ sở hạ tầng: Giám sát đường ống, đường dây điện, cầu và các cơ sở hạ tầng quan trọng khác.
    • Truyền thông và Giải trí: Chụp ảnh trên không, quay video, báo chí.
    • Khai thác mỏ & Khai thác đá, Bảo hiểm, Năng lượng, Y tế & Trợ giúp xã hội.
  • Tiến bộ công nghệ:
    • Cải thiện hiệu quả pin, dẫn đến thời gian bay dài hơn.
    • Tích hợp Trí tuệ nhân tạo (AI) và Học máy (ML) cho các hệ thống tự hành, xử lý dữ liệu nâng cao và cải thiện độ tin cậy.
    • Cảm biến hình ảnh tiên tiến và khả năng phân tích dữ liệu.
    • Phát triển các thiết kế UAV lai (hybrid) (cánh cố định và đa cánh quạt) mang lại sự linh hoạt và độ bền cao hơn.
    • Những tiến bộ trong công nghệ truyền tin (5G/6G, liên kết vệ tinh, truyền tin mạng lưới) cho phép các hoạt động ngoài tầm mắt quan sát trực tiếp (BVLOS: Beyond Visual Line of Sight).
  • Khuôn khổ pháp lý thuận lợi: Khi các quy định phát triển và chính phủ cung cấp hướng dẫn rõ ràng hơn cho các hoạt động của drone (bao gồm BVLOS), nhiều công ty có thể mở rộng ứng dụng drone của họ.
  • Khả năng chi trả và tiếp cận tăng lên: Chi phí thấp hơn cho drone dân dụng và thương mại đang mở rộng phạm vi ứng dụng của chúng.

3. Các phân khúc thị trường chính

  • Theo Platform (Nền tảng):
    • Quốc phòng & Chính phủ: Hiện đang chiếm thị phần lớn nhất do ngân sách cao và các ứng dụng chuyên biệt.
    • Dân sự & Thương mại: Phân khúc tăng trưởng nhanh nhất, được thúc đẩy bởi các ứng dụng công nghiệp đa dạng.
  • Theo End-User (Người dùng cuối):
    • Quân sự: Vẫn là phân khúc thống trị mảng thị trường này.
    • Nông nghiệp: Dự kiến là một trong những phân khúc tăng trưởng nhanh nhất.
    • Các phân khúc quan trọng khác bao gồm an toàn & an ninh công cộng, xây dựng, bán lẻ, năng lượng và giải trí.
  • Theo Type (Loại): Cánh cố định, Cánh quay, Lai (Hybrid). UAV lai (Hybrid) được dự kiến sẽ tăng trưởng nhanh nhất.
  • Theo Payload Capacity (Khả năng tải trọng): Lên đến 2kg (chiếm thị phần doanh thu lớn nhất vào năm 2024, lý tưởng cho giao hàng chặng cuối), 2kg đến 19kg (tăng trưởng nhanh nhất cho an toàn công cộng và ứng phó khẩn cấp).
  • Theo Power Source (Nguồn năng lượng): Pin nhiên liệu hydro dự kiến sẽ có mức tăng trưởng nhanh nhất do những lợi thế như mật độ năng lượng cao hơn và thời gian bay dài hơn so với pin lithium-ion truyền thống.

4. Bức tranh khu vực

  • Bắc Mỹ: Dẫn đầu thị trường về doanh thu, được thúc đẩy bởi chi tiêu quốc phòng đáng kể của Hoa Kỳ và việc áp dụng sớm các công nghệ drone cao cấp trong các lĩnh vực thương mại.
  • Châu Á-Thái Bình Dương: Khu vực tăng trưởng nhanh nhất, được thúc đẩy bởi quá trình công nghiệp hóa nhanh chóng, đầu tư quốc phòng ngày càng tăng (đặc biệt là ở Trung Quốc, Ấn Độ, Nhật Bản, Hàn Quốc) và việc sử dụng drone thương mại rộng rãi trong hậu cần, nông nghiệp và cơ sở hạ tầng. Trung Quốc là một nước lớn trong sản xuất drone.
  • Châu Âu: Tăng trưởng mạnh mẽ được thúc đẩy bởi những tiến bộ trong công nghệ và các ứng dụng thương mại ngày càng tăng.

5. Các công ty sản xuất hàng đầu

Thị trường UAV bao gồm sự kết hợp giữa các gã khổng lồ hàng không vũ trụ và quốc phòng lâu đời, cũng như các công ty công nghệ máy bay không người lái chuyên biệt.

  • Các công ty chủ chốt (trên nhiều phân khúc – thị trường chiến thuật, thị trường thương mại, v.v.):
    • SZ DJI Technology Co. Ltd. (DJI): Thống trị thị trường drone dân sự/thương mại, chiếm ước tính 70% thị phần toàn cầu tính đến năm 2024.
    • General Atomics: Nổi tiếng với các UAV quân sự lớn như MQ-9 Reaper.
    • Elbit Systems Ltd.: Mạnh về công nghệ quân sự, bao gồm các hệ thống UAV.
    • Israel Aerospace Industries Ltd. (IAI): Nổi tiếng với các công nghệ UAV tiên tiến, đặc biệt trong ISR.
    • AeroVironment, Inc.: Nổi bật trong các UAV chiến thuật.
    • The Boeing Company: Một công ty hàng không vũ trụ lớn với trọng tâm vào các giải pháp UAV linh hoạt.
    • Northrop Grumman Corporation: Quan trọng trong các UAV quân sự, bao gồm MQ-4C Triton.
    • BAYKAR TECH (Thổ Nhĩ Kỳ): Công ty đang phát triển nhanh chóng, nổi tiếng với drone chiến đấu Bayraktar TB2.
    • Parrot Drone SAS (Pháp): Một nhà sản xuất quan trọng của châu Âu.
    • Skydio (Mỹ): Nổi tiếng với drone tự hành.
    • Autel Robotics (Trung Quốc)
    • JOUAV (Trung Quốc)
    • AgEagle Aerial Systems Inc. (Hoa Kỳ)
    • Teledyne FLIR LLC: (chuyên về hình ảnh nhiệt và chống UAV)
    • XAG (Trung Quốc): Dẫn đầu về drone nông nghiệp.

6. Các xu hướng mới nổi

  • Tính năng tự hành: Ngày càng tăng cường ứng dụng AI và ML cho các chuyến bay và ra quyết định hoàn toàn tự hành.
  • Dịch vụ giao hàng bằng drone: Tiếp tục mở rộng và phát triển các quy định cho hậu cần chặng cuối.
  • Giải pháp Drone-in-a-box: Cho các hoạt động tự động, liên tục (ví dụ: giám sát an ninh, giám sát địa điểm).
  • Công nghệ drone theo đàn (Swarm Drone Technology): Tiềm năng cách mạng hóa các hoạt động thương mại và quân sự bằng cách phối hợp nhiều drone.
  • Hệ thống chống UAV (C-UAS): Nhu cầu ngày càng tăng đối với các giải pháp phát hiện và giảm thiểu drone do các mối đe dọa an ninh ngày càng tăng từ drone độc hại.
  • Tích hợp với Mạng 5G/6G: Nâng cao khả năng kết nối và truyền dữ liệu thời gian thực.
  • Pin nhiên liệu hydro: Đang ngày càng được quan tâm để kéo dài thời gian hoạt động.
  • Hợp nhất trong ngành: Sáp nhập và mua lại khi các công ty tìm cách củng cố vị thế thị trường của mình.

Tóm lại, thị trường UAV toàn cầu là một lĩnh vực năng động và tăng trưởng cao, chủ yếu được thúc đẩy bởi quá trình hiện đại hóa quốc phòng và mở rộng các ứng dụng thương mại. Mặc dù có nhiều cơ hội phát triển, các nhà sản xuất UAV vẫn phải đối mặt với các thách thức như phức tạp pháp lý về định chế, vấn đề đảm bảo an toàn không lưu.

-

. Suy ngẫm chậm 🤔

Để kết thúc bài post, tôi trân trọng mời anh chị một tách cà phê (ảo). Lần này tôi nhờ một drone mang cà phê đến tận nơi! (Credit: Anthropic Claude)



  • Drone bốn cánh quạt với các cánh quạt quay (có hoạt ảnh)
  • Cốc cà phê với cà phê nóng bốc hơi, hoàn chỉnh với bọt sữa và nhãn hiệu quán cà phê
  • Cơ chế giao hàng - một giá đỡ an toàn kết nối cốc cà phê với drone
  • Chi tiết chân thực như đèn hạ cánh, gimbal camera, và các đường chỉ chuyển động
  • Hiệu ứng hoạt ảnh - chuyển động bay lơ lửng của drone, cánh quạt quay, hơi nước bốc lên, và cốc cà phê lắc lư nhẹ nhàng

Tính năng thú vị:

  • Drone có hoạt ảnh bay lơ lửng để thể hiện nó đang di chuyển trên không
  • Hơi nước bốc lên từ cà phê nóng với hoạt ảnh nhẹ nhàng
  • Cốc cà phê lắc lư nhẹ như thật trong khi bay
  • Chỉ báo trạng thái hiển thị “Coffee Secured” và “En Route to Customer”
  • Nền trời đẹp với mây và mặt trời
  • Bóng dáng thành phố bên dưới để thể hiện môi trường giao hàng

Điều này thể hiện tương lai của việc giao đồ ăn, nơi các drone có thể vận chuyển an toàn các đồ uống nóng trong khi vẫn duy trì nhiệt độ và ngăn ngừa đổ tràn thông qua các cơ chế giao hàng chuyên dụng!

-

Trân trọng & vui nhã

LeVanLoi

☕ Nhàn đàm S&T: Humanoid Robots 🤖

Phác họa bài post: Đề dẫn. ❶. Humanoid Robots hoạt động thế nào? ❷. Lắp ghép một Humanoid Robot như thế nào? ❸. Huấn luyện Humano...