Phác họa bài post:

Đề dẫn.

❶. Humanoid Robots hoạt động thế nào?

❷. Lắp ghép một Humanoid Robot như thế nào?

❸. Huấn luyện Humanoid Robot làm việc

🤔. Suy ngẫm chậm

Phụ lục

Để giúp anh/chị quyết định có đọc tiếp hay không, tôi xin phép cung cấp các thông tin liên quan đến bài post này như sau:

· Chủ đề: Robotics

· Tính thời sự: tháng 06/2026

· Thời gian đọc: 10 phút, kể cả thời gian uống cà phê (uống cà phê xong là đọc xong)

Đề dẫn

Bên cạnh làn sóng “Agentic AI”, gần đây, truyền thông nói khá nhiều về humanoid robot (robot hình người). Báo chí đang mô tả chúng như một bước tiến đầy hứa hẹn, sẵn sàng bước ra đời thực để thay đổi ngành dịch vụ, tự động hóa và giải quyết bài toán thiếu hụt nhân lực toàn cầu. Thậm chí có thuyết âm mưu (conspiracy theory) đưa tin về tham vọng tạo ra đội quân robot có khả năng tự chế tạo đồng loại, với mục tiêu hàng vạn cỗ máy trong vài năm tới!? Tôi vốn là người tò mò (hẳn nhiều anh/chị khác cũng thế) nên hôm nay xin phép đàm luận về chủ đề này. Cấu trúc bài post như sau:

· Đầu tiên xin lược qua về nguyên lý hoạt động của chúng.

· Sau đó là bàn đến việc lắp ghép một robot hình người thì cần những thứ gì và tốn bao nhiêu tiền (ước tính) vào thời điểm hiện nay.

· Cuối cùng là đề cập đến các nguyên lý cơ bản để huấn luyện chúng biết “đi lại”, biết “làm việc”.

Lưu ý rằng bài tuy dài nhưng anh/chị chỉ đọc khoảng 7-8 trang A4 thôi, còn lại là phụ lục.

🤖

❶. Humanoid Robots hoạt động thế nào?

Robot hình người (humanoid robot) được thiết kế để mô phỏng hình dáng và cách hoạt động của cơ thể con người. Chúng kết hợp:

cơ khí,
điện tử,
và phần mềm

để cảm nhận môi trường, đưa ra quyết định và di chuyển giống con người.

Dưới đây là cách các hệ thống chính phối hợp hoạt động cùng nhau:

1. Cấu trúc cơ học (phần “cơ thể”)

Robot hình người có:

khung xương,
các khớp nối,
tay,
chân,
đầu,
thân

tương tự cơ thể người.

Các khớp này được điều khiển bởi actuator (bộ truyền động) như:

động cơ điện,
hệ thống thủy lực,
hoặc khí nén.

Nhờ đó robot có thể:

đi bộ,
xoay người,
cầm nắm,
quay đầu.

2. Cảm biến (phần “giác quan”)

Robot hình người dùng cảm biến để hiểu thế giới xung quanh.

Các loại cảm biến phổ biến:

Camera → thị giác (giống mắt)
Microphone → nghe âm thanh (giống tai)
Con quay hồi chuyển & cảm biến gia tốc → giữ thăng bằng
Cảm biến lực/xúc giác → phát hiện va chạm và áp lực

Dữ liệu từ cảm biến được gửi liên tục đến hệ thống điều khiển.

3. Hệ thống điều khiển (phần “thân não”)

Đây là hệ thống xử lý dữ liệu cảm biến và gửi lệnh đến động cơ.

Nó bao gồm:

vòng phản hồi (feedback loop),
điều khiển chuyển động,
và lập kế hoạch vận động.

Một khái niệm quan trọng là lý thuyết điều khiển. Lý thuyết điều khiển giúp robot:

giữ ổn định,
di chuyển chính xác,
và phối hợp các khớp hiệu quả.

4. AI (phần “não bộ”)

Robot hiện đại thường sử dụng AI để ra quyết định.

AI giúp robot:

nhận dạng vật thể,
nhận diện con người,
hiểu giọng nói,
học hỏi từ dữ liệu,
thích nghi với môi trường.

Ví dụ:

thị giác máy tính (computer vision) giúp robot “nhìn”,
machine learning giúp robot cải thiện “kỹ năng” theo thời gian,
xử lý ngôn ngữ tự nhiên (Natural language processing - NLP) giúp robot “hiểu” lời nói.

5. Hệ thống năng lượng (phần “nguồn sống”)

Đa số robot hình người sử dụng pin.

Một số robot lớn hoặc trong phòng nghiên cứu có thể dùng

nguồn điện ngoài,
hoặc hệ thống thủy lực công suất cao.

Tiết kiệm năng lượng là một trong những thách thức lớn nhất của robot hình người.

6. Thăng bằng và chuyển động (phần khó nhất)

Đi bộ như con người là một bài toán cực kỳ khó.

Robot phải liên tục:

tính toán trọng tâm,
điều chỉnh vị trí chân,
cân bằng cơ thể,
phản ứng với môi trường.

Khái niệm quan trọng ở đây là ổn định động (dynamic stability). Robot phải tính toán mọi thay đổi gần như theo thời gian thực để tránh bị ngã.

Tất cả hoạt động cùng nhau như thế nào?

Ví dụ khi robot nhặt một vật:

Camera phát hiện vật thể
AI xác định đó là gì
Hệ thống lập kế hoạch tính toán cách tiếp cận
Động cơ điều khiển cánh tay
Cảm biến liên tục kiểm tra và hiệu chỉnh chuyển động

Toàn bộ quá trình trên diễn ra hàng trăm lần mỗi giây.

Một cách hình dung đơn giản

Anh/chị có thể xem robot hình người như:

Thành phần	Tương đương con người
Khung cơ khí	Bộ xương
Actuator	Cơ bắp
Cảm biến	Giác quan
Bộ điều khiển	Hệ thần kinh
AI	Não bộ
Pin	Nguồn năng lượng

Tất cả phối hợp với nhau để tạo ra một “cơ thể máy” có thể:

cảm nhận,
suy nghĩ,
và hành động.

🤖

❷. Lắp ghép một Humanoid Robot như thế nào?

Giả thiết rằng chúng ta đang ở trong một giai đoạn mà các cấu phần của robot hình người có sẵn trên thị trường, chúng ta có thể coi việc lắp ráp robot hình người giống như việc lắp ráp một chiếc máy tính PC vào thời những năm 1980, 1990: ghép bo mạch chủ, bộ CPU, card màn hình, màn hình, RAM, đĩa cứng, … Sau khi lắp xong chúng ta cài đặt hệ điều hành (HĐH) - ví dụ HĐH Windows. Sau đó, chúng ta cho máy chạy các ứng dụng, chẳng hạn như trình soạn thảo (Word), bảng tính (Excel), chơi game, …

Tương tự như thế, sau khi lắp xong robot hình người chúng ta cho “chạy” các ứng dụng như:

Trong công nghiệp & sản xuất:

· vận chuyển vật liệu,

· thao tác máy móc,

· kiểm tra,

· lắp ráp

Trong kho vận và logistics:

· gắp hộp,

· vận chuyển hàng tồn kho,

· phân loại,

· bốc xếp

Trong y tế:

· hỗ trợ bệnh nhân,

· hỗ trợ di chuyển,

· phát thuốc,

· giám sát,

· bầu bạn

… Đại loại thế, rất nhiều ứng dụng khác nữa.

Tuy nhiên, chúng ta chưa đến giai đoạn đó. Trên đây mới chỉ ở thì tương lai.

Trở lại với thực tế: lắp một robot hình người cần những thứ gì và giá cả là bao nhiêu? Xin lưu ý với anh/chị rằng hiện nay chưa có nơi nào bán “hệ điều hành” robot hình người cả nên sau khi lắp xong, nó chưa “hoạt động” được đâu. Nhưng thôi, đó là câu chuyện khác. Cái mà chúng ta tò mò là khi dựng robot hình người thì chúng ta cần “những thứ gì”. Để anh/chị dễ hình dung, chúng ta có thể xem hình minh họa dưới đây.

Minh họa các bộ phận của một robot hình người

(Việt hóa từ nguồn)

Robot hình người có rất nhiều loại của rất nhiều công ty như Tesla, Figure AI, Boston Dynamics, Agility Robotics, Unitree Robotics, Apptronics, … Sau khi cân nhắc tôi chọn một mẫu từ Boston Dynamics là Atlas và một mẫu khác từ Unitree Robotics là H1. Lý do cho sự lựa chọn này? Có thể nói Boston Dynamics là một đơn vị nghiên cứu “lâu đời” về robot, và đặc biệt đây là một spin-off từ một dự án nghiên cứu của MIT vào năm 1992. Còn tôi chọn H1 từ Unitree Robotics vì tôi quá ấn tượng với màn trình diễn võ thuật của H1 hôm 30 Tết vừa rồi và màn trình diễn tại Thiên Đàn (Temple of Heaven) sau đó. Có thể ví Atlas như một chuẩn mực robot theo nghĩa “hàn lâm cổ điển” còn H1 là thế hệ robot mới, tươi trẻ, đầy biến ảo.

Để tránh việc kéo anh/chị vào các chi tiết quá kỹ thuật, tôi mô tả danh mục vật tư (Bill of Materials – BOM) để dựng Atlas ở Phụ lục A, H1 ở Phụ lục B. Ngoài ra, tôi cũng lập Phụ lục C để giải thích các khái niệm từ ngữ liên quan đến robot như DOF, PMSM, LiDAR, IMU, … để tiện cho anh/chị tham khảo nếu chưa rõ.

Tóm tắt:

· Atlas cao ~1.90 m, nặng ~ 90 kg (lực sỹ), tổng chi phí ước lượng: 250.000 USD → vài triệu USD

· H1 cao ~1.8m, nặng ~ (47-70) kg (người mẫu), tổng chi phí ước lượng: 60.000 USD → 150.000 USD.

Và, sau khi lắp xong (ra đời), chúng vẫn chưa biết “đi”, vẫn chưa biết “làm việc” gì đâu! 😊

🤖

❸. Huấn luyện Humanoid Robot làm việc

Điều khiến cho chúng ta tò mò nhất là khối điện toán (computing) của humanoid robot – là “bộ não” của nó. Theo như tôi tìm hiểu thì điều khiển robot hình người thuộc vào nhóm phần mềm phức tạp bậc nhất vào thời điểm hiện nay. Các tài liệu trên internet chủ yếu nói về nguyên lý chung. Thực tế điều khiển như thế nào là bí quyết của các công ty, không mở. Phần này tôi chia thành 2 mục. Mục ⓐ nói về nguyên lý điều khiển và mục ⓑ nói về cách robot “học việc”.

ⓐ. Nguyên lý điều khiển Humanoid Robot

Do humanoid robot đang ở trong giai đoạn đầu của sự phát triển (thử nghiệm + vài lô sản phẩm mang tính pilot) nên vẫn chưa xuất hiện “kiến trúc chuẩn”. Mặc dầu vậy, các nghiên cứu hiện nay có xu thế phân tầng. Tầng cao nhất điều khiển tầng thấp hơn kế tiếp, tầng thấp hơn kế tiếp lại điều khiển tầng thấp hơn nữa tiếp theo, … Cho đến tầng cuối cùng là tầng điều khiển thời gian thực.

Có thể hình dung một cách đơn giản như sau (từ mức cao đến mức thấp):

(1) Câu lệnh

│

(2) Lập kế hoạch tác vụ

│

(3) Mô hình thế giới (World Model)
[môi trường xung quanh: vật thể, người, chướng ngại vật, khoảng trống, …]

│

(4) Lập kế hoạch chuyển động

│

(5) Điều khiển toàn thân (Whole-Body Control)

│

(6) Điều khiển đi bộ (Locomotion Control)

│

(7) Điều khiển động cơ và cơ cấu chấp hành (Actuators)

Diễn giải một cách nôm na:

(1) Robot nhận được câu lệnh, ví dụ: “đến lau vết loang cà phê ở trên bàn”. Lúc này robot sử dụng AI (LLM) để hiểu câu lệnh.

(2) Sau khi hiểu ý định từ câu lệnh, robot lập kế hoạch tác vụ: đi đến bàn → cầm giẻ lau → lau vết loang cà phê.

(3) Tiếp theo, robot sử dụng hệ thống nhận thức của mình biến dữ liệu cảm biến thành hiểu biết về môi trường xung quanh:

Camera → Xử lý ảnh → Mạng nơ-ron (Neural Network) → Nhận dạng đối tượng → Hiểu bối cảnh → Mô hình thế giới (World Model).

Ví dụ về Mô hình thế giới (World Model):

· Vật thể đã nhận diện

· Không gian trống

· Con người xung quanh

· Vị trí chướng ngại vật

· Tiến độ công việc

(4) Lập kế hoạch chuyển động (sử dụng AI): Đi đến bàn, lấy giẻ lau, lau vết loang.

(5) Điều khiển toàn thân (Whole-Body Control). Robot hình người thường có từ 20–50+ bậc tự do (Degrees of Freedom) nên điều khiển phải phối hợp chân, tay, thân, cổ, bàn tay đồng thời thỏa mãn Điều kiện cân bằng; Giới hạn khớp; Ràng buộc tiếp xúc; Giới hạn mô-men. Đại thể: Chuyển động mong muốn → Bộ điều khiển toàn thân → Mô-men khớp

(6) Điều khiển đi bộ (Locomotion Control). Việc đi bộ thường được xử lý bởi một hệ thống chuyên biệt:

Lập kế hoạch bước chân → Sinh dáng đi → Điều khiển cân bằng → Lệnh điều khiển khớp

Chức năng:

· Cân bằng động

· Chống bị đẩy ngã

· Leo cầu thang

· Đi trên địa hình không bằng phẳng

Các robot tiên tiến liên tục tính toán lại vị trí bước chân trong khi đang di chuyển.

(7) Điều khiển động cơ và cơ cấu chấp hành (Actuators). Đây là tầng thấp nhất điều khiển trực tiếp các động cơ – điều khiển thời gian thực.

Các vòng lặp điều khiển lồng nhau:

{Điều khiển vị trí → Điều khiển vận tốc → Điều khiển mô-men → Điều khiển dòng điện} ⁿ

Các vòng lặp thường chạy ở tần số hàng kHz. Nghĩa là toàn bộ vòng lặp điều khiển trên phải dưới 1 mili giây: trong 1 giây vòng điều khiển chạy trên 1 nghìn lần.

Kiến trúc này giúp việc điều khiển đạt độ chính xác cao, ổn định, phản ứng nhanh với nhiễu động của môi trường xung quanh.

🤖

ⓑ. Humanoid robot học việc như thế nào?

Bây giờ chúng ta bàn đến việc huấn luyện cho robot biết “làm việc”. Nhưng đầu tiên, chúng ta tự hỏi: “việc” được định nghĩa thế nào?

Trong robot công nghiệp truyền thống, “việc” được đặc tả chính xác đến từng milimet. Ví dụ: nhấc linh kiện X từ A đến B (dài 500 milimet), rẽ trái vuông góc đến điểm C (dài 200 milimet) và đặt linh kiện vào hộp D. Trong trường hợp này, thông thường người ta lập trình sẵn và để thực hiện công việc đó, người ta chỉ cần cho robot “chạy” theo chương trình là được.

Trong trường hợp humanoid robot, “việc” được định nghĩa rất mơ hồ: “nhặt rác trong phòng A”, “lau vết cà phê loang trên bàn B”, … Người ta cần một cách tiếp cận khác so với robot công nghiệp. Họ huấn luyện robot hình người dựa trên sự kết hợp giữa AI & thị giác máy tính (computer vision). Phương pháp này giúp robot học hỏi tương tự như con người học việc—thông qua quan sát, thực hành rồi điều chỉnh, thử sai (trial and error).

Dưới đây là các bước chi tiết về cách người ta huấn luyện robot hình người tham gia vào lực lượng lao động.

1. Học bắt chước (Điều khiển từ xa - Teleoperation)

Trước khi một robot có thể hoạt động tự động, nó thường cần một người "cầm tay chỉ việc". Quá trình này được gọi là Học bắt chước (Imitation Learning) hoặc Sao chép hành vi (Behavioral Cloning) gồm các bước:

Thiết lập: Một người vận hành sẽ đeo kính thực tế ảo (VR), đeo găng tay theo dõi chuyển động (motion-tracking gloves), hoặc một bộ khung xương ngoài (exoskeleton) chuyên dụng.
---
❓ Motion-tracking gloves: (găng tay theo dõi chuyển động) trong robotics là thiết bị đeo tay ghi lại chính xác cử động của ngón tay và bàn tay. Dữ liệu này được chuyển thành lệnh điều khiển thời gian thực cho cánh tay hoặc bàn tay robot, giúp robot bắt chước thao tác của con người.
❓ Exoskeleton: (bộ khung xương ngoài) mặc lên người, được thiết kế để mô phỏng hoạt động của cơ thể người.
Hành động: Con người thực hiện công việc thực tế (ví dụ: nhấc một chiếc hộp, sắp xếp hàng lên kệ hoặc sử dụng máy khoan).
Dữ liệu: Các cảm biến trên người vận hành và camera theo dõi môi trường sẽ ghi lại từng góc khớp, lực tác động và các tín hiệu thị giác. AI của robot sẽ phân tích dữ liệu này để hiểu mối tương quan giữa những gì nó nhìn thấy và cách nó nên di chuyển.

Xem video demo.

2. Mô phỏng

Việc huấn luyện robot trong thế giới thực rất chậm, tốn kém và nguy hiểm (chúng có thể tự làm hỏng mình hoặc làm hỏng thiết bị xung quanh). Để giải quyết vấn đề này, người ta sử dụng phương pháp Sim-to-Real - Sim2Real (từ Mô phỏng sang Thực tế).

Digital Twins (Bản sao kỹ thuật số): Họ tạo ra các bản sao ảo 3D siêu thực của môi trường làm việc (kho bãi, nhà máy) và chính con robot đó, với đầy đủ các định luật vật lý chính xác (trọng lực, ma sát, khối lượng).
Tăng tốc thời gian: Trong môi trường mô phỏng, một robot có thể thực hiện một tác vụ hàng triệu lần chỉ trong vài giờ.
Domain Randomization (Ngẫu nhiên hóa môi trường): Người ta cố tình làm xáo trộn môi trường mô phỏng—thay đổi ánh sáng, thay đổi bề mặt của vật thể hoặc thêm "nhiễu" kỹ thuật số. Điều này đảm bảo rằng khi robot bước ra thế giới thực, một sự thay đổi nhỏ về ánh sáng sẽ không làm nó bị "đơ".

3. Reinforcement Learning

Sau khi robot đã có khái niệm cơ bản về công việc nhờ vào việc bắt chước, nó sẽ sử dụng Reinforcement Learning để hoàn thiện kỹ năng đó. Đây là phương pháp "củ cà rốt và cây gậy" phiên bản kỹ thuật số.

Hàm phần thưởng (Reward Function): Người ta lập trình một hệ thống phần thưởng bằng toán học. Nếu robot đặt thành công một linh kiện lên băng chuyền, nó sẽ được cộng "điểm". Nếu nó làm rơi linh kiện hoặc đâm vào tường, nó sẽ bị trừ điểm.
Tự sửa lỗi: Robot sẽ thử hàng ngàn biến thể chuyển động nhỏ khác nhau để tối đa hóa số điểm của mình, cuối cùng tìm ra cách hiệu quả và ổn định nhất để hoàn thành công việc.

4. Vision-Language-Action

Bước tiến tiên phong mới nhất trong việc huấn luyện robot được kế thừa từ tư duy của ChatGPT. Giống như cách LLM dự đoán “từ” tiếp theo trong một câu, mô hình Vision-Language-Action (VLA) (Thị giác - Ngôn ngữ - Hành động) sẽ dự đoán “hành động vật lý” tiếp theo.

Cách thức hoạt động: Chúng ta có thể ra lệnh cho robot bằng ngôn ngữ tự nhiên: "Hãy đi tìm chỗ cà phê bị đổ và lau sạch nó." AI tích hợp trên robot sẽ dịch dữ liệu hình ảnh (vết đổ), đối chiếu với dữ liệu đã được huấn luyện về việc "dọn dẹp", và tự động đưa ra các lệnh vận hành mô-tơ để nhặt khăn giấy và lau bề mặt.

---

❓ VLA hoạt động theo nguyên lý nào? Một cách cô đọng: nhận thức thị giác – suy luận ngữ nghĩa – giải mã hành động:

· Nhận thức thị giác (Visual Perception): Camera quét môi trường để trích xuất hình học không gian, xác định đối tượng và lập bản đồ mối quan hệ của chúng mà không cần nhãn được lập trình trước.

· Suy luận ngữ nghĩa (Semantic Reasoning): LLM diễn giải chỉ dẫn ngôn ngữ tự nhiên của con người và áp dụng suy luận thường thức để lập “kế hoạch” dựa trên những gì robot thực sự nhìn thấy.

· Giải mã hành động (Action Decoding): Bộ giải mã hành động dịch “kế hoạch” trên thành các quỹ đạo vận động chính xác, liên tục cho cánh tay, khớp và bộ kẹp của robot theo thời gian thực (với tốc độ lên đến hàng kHz – xem ở trên).

---

5. Triển khai và tinh chỉnh tại chỗ (Edge Fine-Tuning)

Cuối cùng, mô hình AI đã hoàn thiện sẽ được tải vào robot hình người bằng xương bằng thịt.

"Ngày đi làm đầu tiên": Robot bước vào nơi làm việc thực tế. Nó sử dụng các cảm biến tích hợp (LiDAR, camera, cảm biến lực ở bàn tay) để điều hướng và định vị.
Học tập liên tục: Trong quá trình làm việc, robot sẽ tải dữ liệu về bất kỳ lỗi sai hoặc tình huống mới lạ nào mà nó gặp phải lên Cloud. Người ta sẽ tinh chỉnh mô hình trên Cloud, và một "bộ não" được cập nhật sẽ được gửi lại cho toàn bộ đội ngũ robot (các robot cùng loại). Nghĩa là:
Robot → [Quá trình làm việc] → [Cloud: tinh chỉnh mô hình] → Robot

🤖

🤔. Suy ngẫm chậm

Trong bài trước tôi đàm luận về Agentic AI (LLM Agent). Thật thú vị vì Agentic AI có quan hệ mật thiết với Humanoid Robot. Người ta ví LLM Agent như “bộ não” còn Humanoid Robot là “cơ thể”.

✪

Dưới dạng thuần túy là phần mềm, "hành động" của LLM Agent bị giới hạn trong thế giới kỹ thuật số (ví dụ: viết code, đặt vé máy bay, gửi email).

Khi LLM Agent có “cơ thể”, robot hình người cung cấp phần cứng vật lý — cảm biến, bộ truyền động, tay chân và khả năng di chuyển — cần thiết để tương tác với thế giới thực.

Agentic AI mang lại cho cỗ máy khả năng suy nghĩ và ra quyết định, trong khi robot hình người cho chúng khả năng hành động trong thế giới vật lý. Nếu không có LLM Agent, robot hình người chỉ là những con rối điều khiển từ xa hoặc những cỗ máy lặp lại một cách mù quáng. Nếu không có robot hình người, LLM Agent sẽ mãi bị mắc kẹt bên trong màn hình máy tính. Khi kết hợp lại, chúng tạo nên nền tảng cho Robot hình người đa năng.

✪

Gần đây chúng ta nghe truyền thông hay dùng đến các cụm từ Embodied AI (tạm dịch là AI nhập thể) hoặc cụm từ Physical AI (AI vật lý). Đó chính là giao điểm của hai lĩnh vực Agentic AI và Humanoid Robot.

~~~

Chúc anh/chị đọc vui nhã

LeVanLoi

~~~

Phụ lục

Phụ lục A: Danh mục vật tư để lắp ghép humanoid robot Atlas (Boston Dynamics)

Hiện không có danh mục vật tư (BOM — Bill of Materials) chính thức công khai cho Atlas vì phần lớn phần cứng của nó là công nghệ độc quyền. Tuy nhiên, dựa trên các bài nghiên cứu, phân tích chuỗi cung ứng, tài liệu robot học, và các thông số được quan sát công khai, ta có thể xây dựng một BOM ước lượng ở cấp độ kỹ thuật cho một robot “cùng đẳng cấp” với Atlas.

Những gì thông số công khai cho biết

chiều cao khoảng 190 cm
khối lượng khoảng 90 kg
~28 DOF (Atlas đời cũ), ~56 DOF (ước lượng Atlas điện đời mới)

1. Khung cơ khí (Structural Frame)

Thành phần	Số lượng	Ghi chú
Khung titan/nhôm	1 bộ	Bộ xương chính
Vỏ khớp gia công CNC	~30	Hông, gối, vai…
Tấm phủ sợi carbon	1 bộ	Vỏ ngoài nhẹ
Vòng bi con lăn chéo	~40–60	Khớp chịu tải lớn
Bu lông, spacer, shim	Hàng trăm	Chuẩn hàng không
Bộ giảm rung	~20	Giảm rung động

2. Hệ truyền động (Actuation System)

Atlas trước đây dùng thủy lực; thế hệ mới hoàn toàn chạy điện.

Bộ truyền động kiểu Atlas chạy điện

Thành phần	Số lượng	Ghi chú
Động cơ BLDC mô-men xoắn cao	28–56	Mỗi bậc tự do một động cơ
Harmonic drive	20–40	Giảm tốc chính xác
Hộp số cycloidal	Tùy chọn	Cho khớp tải nặng
Bộ điều khiển động cơ/inverter	28–56	Điều khiển mô-men thời gian thực
Encoder tuyệt đối	28–56	Đo vị trí khớp
Cảm biến mô-men xoắn	10–20	Phản hồi lực
Vỏ actuator tùy chỉnh	1 bộ	Module tích hợp

Điểm quan trọng

Một khớp Atlas thường tích hợp:

động cơ,
hộp số,
encoder,
bộ điều khiển,
hệ thống làm mát,

tất cả trong một module actuator nhỏ gọn.

3. Tay và hệ thao tác vật thể

Thành phần	Số lượng	Ghi chú
Tay robot/gripper	2	Tay nhiều ngón hoặc kẹp công nghiệp
Bộ truyền động ngón tay	6–20	Tùy độ linh hoạt
Cảm biến xúc giác	Nhiều	Phản hồi lực cầm
Hệ thống tendon/cáp	Tùy chọn	Bắt chước gân tay người

Bàn tay linh hoạt là một trong những hệ thống khó và đắt nhất.

4. Hệ cảm biến

Thị giác

Thành phần	Số lượng	Ghi chú
Camera RGB stereo	2–6	Nhận biết chiều sâu
Camera chiều sâu	1–3	Lập bản đồ địa hình
LiDAR	1	Quét 3D

Chuyển động và thăng bằng

Thành phần	Số lượng	Ghi chú
IMU	1–3	Định hướng/thăng bằng
Cảm biến lực ở chân	2–4	Lực phản hồi mặt đất
Encoder khớp	Mỗi khớp	Phản hồi vị trí

Atlas phụ thuộc rất nhiều vào hệ thống nhận diện môi trường để di chuyển và thao tác.

5. Hệ tính toán (Compute Stack)

Thành phần	Số lượng	Ghi chú
CPU hiệu năng cao	1–3	Điều khiển chuyển động
Module GPU AI	1–2	Thị giác máy tính + AI
Board điều khiển thời gian thực	Nhiều	Servo độ trễ thấp
FPGA / vi điều khiển	Nhiều	Điều khiển động cơ
Ethernet/CAN bus	Toàn hệ thống	Giao tiếp robot

6. Hệ nguồn năng lượng

Thành phần	Số lượng	Ghi chú
Bộ pin điện áp cao	1–2	Nguồn chính
Hệ thống quản lý pin (BMS)	1	An toàn và cân bằng
Bộ chuyển đổi DC	Nhiều	Các mức điện áp khác nhau
Hệ thống làm mát	1 bộ	Làm mát động cơ và máy tính
Công tắc ngắt khẩn cấp	1	An toàn

7. Hệ phần mềm (Software Stack)

Không phải BOM vật lý nhưng cực kỳ quan trọng.

Lớp phần mềm	Ví dụ
Hệ điều hành	Linux / RTOS
Middleware robot	ROS 2
Lập kế hoạch chuyển động	Whole-body control
AI nhận thức	Computer vision
SLAM / điều hướng	Mapping & localization
Reinforcement learning	Chuyển động động học

Boston Dynamics sử dụng hệ thống điều khiển tùy chỉnh rất phức tạp.

8. Ước lượng bậc tự do (DOF)

Một cấu hình robot kiểu Atlas thực tế:

Bộ phận	DOF
Mỗi tay	7
Mỗi bàn tay	5–12
Thân	3
Cổ/đầu	2–3
Mỗi chân	6

Tổng cộng:

~28 DOF (Atlas đời cũ)
~56 DOF (ước lượng Atlas điện đời mới)

9. Ước lượng chi phí

Hệ thống	Chi phí ước lượng
Actuator + hộp số	80.000–250.000 USD
Cảm biến	10.000–50.000 USD
Phần cứng tính toán	5.000–25.000 USD
Gia công cơ khí	30.000–150.000 USD
Pin và nguồn	10.000–30.000 USD
Bàn tay robot	20.000–100.000 USD
Phát triển phần mềm	Hàng triệu USD

Tổng chi phí ước lượng: 250.000 USD → vài triệu USD

tùy thuộc vào:

hiệu năng,
mức tự động,
độ khéo léo,
quy mô sản xuất.

🤖

Phụ lục B: Danh mục vật tư để lắp ghép humanoid robot Unitree H1

BOM (Bill of Materials — danh sách vật tư linh kiện) cấp độ sản xuất thực sự của robot humanoid Unitree Robotics H1 hiện không được công khai. Unitree không phát hành CAD, sơ đồ mạch, danh sách nhà cung cấp, thiết kế hộp số, thông số cuộn dây động cơ, layout PCB.

Tuy nhiên, dựa trên thông số công khai, phân tích kiểu teardown, thực tiễn thiết kế robot humanoid, và dữ liệu động học/hiệu năng đã công bố, ta có thể xây dựng một BOM kỹ thuật khá sát với một robot “H1-class”.

Những gì thông số công khai cho biết

chiều cao khoảng 180 cm
khối lượng khoảng 47–70 kg tùy phiên bản
20–27 bậc tự do (DOF)
actuator PMSM tùy biến
mô-men xoắn đầu gối 360 N·m
pin hot-swap 864 Wh
LiDAR 3D + camera chiều sâu
Intel i5/i7 + NVIDIA Orin tùy chọn

1. Khung cơ khí (Structural Frame)

Thành phần	Số lượng	Thông số khả năng cao
Link khung CNC nhôm	~35	6061-T6 / 7075-T6
Tấm vỏ carbon fiber	~20	Vỏ nhẹ
Bu lông titanium	~300	M2–M8
Crossed roller bearing	~25	Ổ trục chính xác cao
Vỏ hộp giảm tốc	~20	Gia công custom
Bàn chân + đệm cao su	2	Giảm chấn

Khung nhiều khả năng chủ yếu dùng hợp kim nhôm với gia cường tại các khớp chịu tải lớn.

2. Hệ truyền động (Actuation System)

Đây là phần đắt nhất của robot.

H1 dùng actuator PMSM mô-men cao, quán tính thấp do Unitree tự phát triển.

Phân bố actuator ước lượng

Khớp	Số lượng	Mô-men xoắn
Hông yaw/pitch/roll	6	120–220 N·m
Đầu gối	2	360 N·m
Cổ chân	2–4	60–150 N·m
Eo	1–3	120–220 N·m
Vai	6	40–120 N·m
Khuỷu tay	2	40–80 N·m
Cổ tay	0–6	10–40 N·m

Mỗi actuator có thể bao gồm

động cơ PMSM
harmonic drive hoặc cycloidal reducer
driver FOC servo
encoder từ tính
cảm biến torque (xoắn)
phanh điện
cảm biến nhiệt
node CAN-FD hoặc EtherCAT

Tổng cộng:

khoảng 20–27 module actuator hoàn chỉnh.

3. Hệ cảm biến

Cảm biến	Số lượng	Ghi chú
LiDAR 3D	1	Có thể thuộc dòng Livox/Mid360
Camera chiều sâu	1–2	Kiểu Intel RealSense
IMU	1–3	6 hoặc 9 trục
Encoder khớp	20–27	Absolute magnetic encoder
Cảm biến torque	20–27	Strain sensor tích hợp
Cảm biến lực bàn chân	4–8	Dùng cân bằng/ZMP
Microphone	1–2	Tùy chọn
Loa	1	Tùy chọn

4. Hệ tính toán (Compute Stack)

Thành phần	Số lượng	Ghi chú
Mini PC Intel i5/i7	1	Máy tính điều khiển chính
NVIDIA Jetson Orin NX	1–3	AI inference
Real-time motor controller	1	STM32 / FPGA / RT Linux
EtherCAT master	1	Motion bus
SSD NVMe	1	Lưu trữ
Wi-Fi/Bluetooth	1	Giao tiếp

5. Hệ nguồn năng lượng

Thành phần	Số lượng	Ghi chú
Pin lithium 67.2V	1	15 Ah / 864 Wh
BMS	1	Quản lý pin
DC bus dòng cao	1	60–80V
Bộ DC-DC	Nhiều	48V/24V/12V/5V
Mạch emergency stop	1	Safety-critical
Power distribution board	1	Có fuse bảo vệ

6. Dây dẫn và truyền tin

Thành phần	Số lượng ước lượng
Dây motor chống nhiễu	~40
Harness encoder	~30
Cáp EtherCAT/CAN	~30
Connector chống rung	~100
Bộ strain relief	Nhiều

Đi dây là một trong những bài toán khó nhất của humanoid robot.

7. Hệ tản nhiệt

Thành phần	Số lượng
Heat sink	Nhiều
Vapor chamber / copper spreader	Một số
Quạt axial nhỏ	2–6
Thermal pad	Nhiều

Các khớp gối và hông sinh nhiệt rất lớn.

8. Software Stack

Không thuộc BOM phần cứng nhưng cực kỳ quan trọng.

Layer	Công nghệ khả năng cao
Real-time control	RT Linux
Middleware	ROS 2
Motion planning	MPC + RL
Simulation	Isaac Gym / MuJoCo
Locomotion	Reinforcement Learning
Vision	CUDA/TensorRT

Chi phí sản xuất ước tính

Hệ thống	Chi phí
Actuator	35k–80k USD
Cơ khí	8k–20k USD
Cảm biến	2k–10k USD
Compute	2k–8k USD
Pin + nguồn	1k–4k USD
Lắp ráp + kiểm thử	10k–30k USD
Tổng BOM	~60k–150k USD

Con số này tương đối phù hợp với các tin đồn về giá thương mại của H1.

Top of Form

Bottom of Form

🤖

Phụ lục C: Giải thích

❰Giải thích - DOF❱

Trong robot học, DOF là viết tắt của Degrees of Freedom (Bậc tự do). Đây là số lượng chuyển động độc lập tối thiểu mà một bộ phận của robot (ví dụ: đầu gắp) có thể thực hiện trong không gian.

Khái niệm này quyết định độ linh hoạt và khả năng tiếp cận các vị trí phức tạp của robot.

Trong không gian 3 chiều, một vật thể có tối đa 6 bậc tự do (6 DOF), được chia thành 2 nhóm chính:

· 3 chuyển động tịnh tiến (Translation): Di chuyển dọc theo trục trái-phải (X), lên-xuống (Y), và tới-lui (Z).

· 3 chuyển động xoay (Rotation):

Pitch (Xoay dọc/Gật đầu): Chúc lên hoặc chúc xuống.
Yaw (Xoay ngang/Lắc đầu): Xoay sang trái hoặc sang phải.
Roll (Nghiêng/Lăn): Nghiêng đầu sang hai bên.

❰/Giải thích - DOF❱

❰Giải thích - Reinforcement learning❱

Reinforcement Learning (RL - Học tăng cường) trong robotics là một nhánh của AI, cho phép robot tự học cách thực hiện các nhiệm vụ thông qua phương pháp mày mò (trial-and-error) để tối đa hóa điểm thưởng nhận được từ môi trường.

Các thành phần cốt lõi

· Agent: Chính là robot đang thực hiện nhiệm vụ.

· Environment (Môi trường): Không gian xung quanh nơi robot hoạt động.

· State (Trạng thái): Vị trí hiện tại, góc độ, hoặc thông tin cảm biến của robot tại một thời điểm.

· Action (Hành động): Các chuyển động hoặc thao tác mà robot thực hiện (ví dụ: tiến lên, xoay tay cầm).

· Reward (Phần thưởng): Tín hiệu phản hồi từ môi trường (dương khi thực hiện đúng mục tiêu, âm khi phạm lỗi hoặc va chạm).

Quá trình robot học hỏi

· Robot quan sát trạng thái hiện tại của môi trường.

· Thực hiện một hành động.

· Quan sát trạng thái mới và nhận phần thưởng (hoặc hình phạt) dựa trên kết quả hành động đó.

· Lặp lại quá trình hàng triệu lần (thường diễn ra trong môi trường mô phỏng máy tính 3D giả lập trước). Qua đó, robot tìm ra chuỗi hành động tối ưu nhất.

Ứng dụng thực tế

· Khả năng thích ứng: Robot có thể tự điều chỉnh tư thế thăng bằng khi đi trên địa hình gồ ghề mà không cần con người lập trình trước từng bước di chuyển.

· Thao tác linh hoạt: Huấn luyện cánh tay robot cách cầm nắm các vật thể có hình dáng, kích thước và trọng lượng khác nhau.

· Di chuyển tự động: Tối ưu hóa đường đi cho các loại xe tự lái hoặc robot tự hành trong kho bãi.

❰/Giải thích - Reinforcement learning❱

❰Giải thích - PMSM❱

Trong lĩnh vực robotics, PMSM (Permanent Magnet Synchronous Motor) là động cơ đồng bộ nam châm vĩnh cửu. Đây là trái tim của các hệ thống truyền động hiện đại, thường được dùng làm động cơ servo để điều khiển các khớp của robot công nghiệp, cánh tay robot, và robot di động (AGV/AMR) nhờ độ chính xác, tốc độ và mô-men xoắn vượt trội.

· Mật độ công suất cao: Động cơ nhỏ gọn nhưng cung cấp lực kéo (mô-men xoắn) cực lớn, rất lý tưởng cho các thiết kế robot cần tối ưu trọng lượng.

· Điều khiển cực kỳ chính xác: Cho phép điều khiển vị trí, vận tốc và gia tốc đến từng mili giây, giúp robot thực hiện các thao tác phức tạp như hàn, lắp ráp hoặc phẫu thuật.

· Phản hồi nhanh: Mô-men xoắn lớn ngay cả ở tốc độ thấp giúp robot khởi động và dừng tức thì mà không có độ trễ.

· Độ bền cao & Không cần bảo trì: Do không sử dụng chổi than (cấu trúc rotor dùng nam châm vĩnh cửu), động cơ hoạt động êm ái và ít hao mòn cơ học.

❰/Giải thích - PMSM❱

❰Giải thích - LiDAR 3D❱

LiDAR 3D (Light Detection and Ranging) là công nghệ cảm biến sử dụng tia laser để đo khoảng cách, quét và tái tạo lại môi trường xung quanh thành bản đồ không gian ba chiều. Đây được xem là "đôi mắt" của robot, cung cấp dữ liệu hình học chính xác theo thời gian thực giúp robot nhận thức, điều hướng và tránh vật cản.

Nguyên lý hoạt động:

· Phát tia: Cảm biến liên tục phát ra các chùm tia laser (thường là tia hồng ngoại) vào không gian.

· Đo thời gian: Các tia này khi gặp vật thể sẽ phản xạ ngược lại cảm biến. Hệ thống sẽ tính toán thời gian tia laser đi và về để suy ra khoảng cách chính xác.

· Dựng hình 3D: Hàng triệu điểm dữ liệu này (gọi là point cloud) được kết hợp lại để tạo ra một bản đồ 3D chi tiết về hình dáng, kích thước và vị trí của mọi vật thể.

Vai trò cốt lõi trong Robotics:

· Lập bản đồ (Mapping): Xây dựng mô hình 3D chính xác của các khu vực xung quanh ngay cả trong điều kiện thiếu sáng.

· Định vị (Localization): Giúp robot biết được chính xác vị trí của nó ở đâu trong không gian làm việc.

· Tránh vật cản: Phát hiện các chướng ngại vật tĩnh hoặc động (như con người, vật nuôi) để tính toán đường đi an toàn.

· Phân loại vật thể: Nhận diện và phân biệt các vật thể khác nhau dựa trên cấu trúc hình học.

❰/Giải thích - LiDAR 3D❱

❰Giải thích - Depth camera❱

Depth camera (camera cảm biến chiều sâu) là thiết bị cung cấp thông tin khoảng cách từ ống kính đến từng điểm của vật thể. Trong robotics, nó cung cấp nhận thức không gian 3 chiều giúp robot "nhìn" và hiểu môi trường xung quanh thay vì chỉ ghi nhận hình ảnh phẳng (2D) thông thường.

Các loại Depth Camera phổ biến:

· Time-of-Flight (ToF): Phát ra xung ánh sáng hồng ngoại và đo thời gian ánh sáng phản xạ lại từ vật thể để tính toán khoảng cách.

· Stereo Vision: Sử dụng 2 hoặc nhiều camera tiêu chuẩn đặt cách nhau, bắt chước thị giác con người, so sánh sự khác biệt hình ảnh để dựng bản đồ chiều sâu.

· Structured Light: Chiếu một mẫu lưới tia sáng hồng ngoại (hoặc laser) lên vật thể, hệ thống sẽ phân tích độ cong/biến dạng của mẫu lưới đó để tính toán bề mặt không gian.

Vai trò cốt lõi trong Robotics:

· Điều hướng & Lập bản đồ (SLAM): Giúp robot tự hành (AGV, AMR) lập bản đồ môi trường, nhận diện lối đi, đo đạc kích thước phòng và không gian xung quanh.

· Nhận diện & Phân loại vật thể: Phân tích hình dạng và khối lượng của các đồ vật phức tạp (như dây điện nhỏ, ghế, hộp) giúp robot gắp sản phẩm chính xác.

· Tránh vật cản (Obstacle Avoidance): Phát hiện các mối nguy hiểm di động hoặc tĩnh tại, tính toán khoảng cách tức thì để dừng lại hoặc đi vòng qua vật cản.

❰/Giải thích - Depth camera❱

❰Giải thích - IMU❱

Trong robotics, IMU (Inertial Measurement Unit - Bộ đo lường quán tính) là một hệ thống cảm biến dùng để đo lường gia tốc tuyến tính và tốc độ góc của robot. Đây là "hệ thống tiền đình" giúp robot nhận biết sự thay đổi về phương hướng, góc nghiêng và trạng thái chuyển động trong không gian 3 chiều.

Các thành phần chính của IMU

IMU thường là sự kết hợp của 2 đến 3 loại cảm biến cơ bản trên cùng một bo mạch:

· Gia tốc kế (Accelerometer): Đo gia tốc và lực tác dụng lên robot (bao gồm cả trọng lực). Giúp xác định hướng của trọng lực và tính toán vị trí, vận tốc tịnh tiến.

· Con quay hồi chuyển (Gyroscope): Đo tốc độ góc của robot khi nó xoay quanh các trục (Pitch - chúi/ngửa, Roll - nghiêng trái/phải, Yaw - xoay vòng).

· La bàn số (Magnetometer - có thể có): Đo từ trường trái đất để xác định hướng tuyệt đối (tương tự như la bàn thông thường), giúp khắc phục sai số góc quay theo thời gian.

Vai trò cốt lõi trong Robotics

IMU là một trong những cảm biến quan trọng nhất quyết định độ tự chủ của robot nhờ khả năng:

· Duy trì thăng bằng: Rất quan trọng với robot hình người, robot 2 bánh tự cân bằng (như robot giao hàng tự động - AGV) hay máy bay không người lái (drone).

· Định vị tương đối (Dead Reckoning): Cung cấp dữ liệu để robot tự tính toán vị trí, hướng đi hiện tại ngay cả khi mất tín hiệu GPS hoặc camera.

· Dẫn đường và lập bản đồ (SLAM): Kết hợp dữ liệu IMU cùng cảm biến LiDAR hoặc Camera để tạo bản đồ môi trường xung quanh một cách chính xác mà không bị giật lag khi robot di chuyển.

❰/Giải thích - IMU❱

❰Giải thích - Harmonic reducer❱

Harmonic reducer (còn gọi là bộ giảm tốc sóng hài hay hộp số Harmonic) là một cơ cấu truyền động cơ khí đặc biệt, đóng vai trò là "khớp xương" cốt lõi cho các khớp của cánh tay robot. Nó giúp giảm tốc độ quay từ động cơ nhưng tăng mô-men xoắn (lực vặn) lên nhiều lần với độ chính xác cực kỳ cao và kích thước nhỏ gọn.

· Độ rơ bằng 0 (Zero Backlash): Không có độ trễ cơ học giữa đầu vào và đầu ra, cho phép robot lặp lại thao tác tại một điểm với độ chính xác tuyệt đối.

· Tỷ số truyền cực lớn: Có thể giảm tốc từ 50 đến 160 lần chỉ trong một thiết kế nhỏ gọn, nhẹ nhàng.

· Tỷ lệ công suất trên trọng lượng cao: Cung cấp lực mạnh mẽ nhưng không làm cánh tay robot bị quá tải về khối lượng.

❰/Giải thích - Harmonic reducer❱

❰Giải thích - Cycloidal drives❱

Cycloidal drives (hộp số cycloidal/hộp số xích lô) là một cơ cấu truyền động cơ học đặc biệt, được sử dụng trong các khớp của robot để giảm tốc độ quay của động cơ đồng thời khuếch đại mô-men xoắn (lực xoắn). Chúng đóng vai trò cốt lõi trong việc giúp các khớp tay máy chuyển động mượt mà và mạnh mẽ.

· Chịu tải trọng sốc (va đập) cực tốt: Khác với hộp số Harmonic, Cycloidal drives có khả năng chịu được các lực tác động hoặc va đập bất ngờ lớn gấp 5 lần mức định mức. Điều này rất lý tưởng cho các robot cộng tác (cobot) thường xuyên làm việc gần con người.

· Mô-men xoắn lớn, kích thước nhỏ: Cung cấp tỷ số truyền cao (từ 10:1 lên tới hàng trăm:1 chỉ trong một cấp giảm tốc) nhưng có thiết kế nhỏ gọn, tiết kiệm không gian cho cánh tay robot.

· Độ chính xác cao, độ rơ thấp (low backlash): Cho phép robot định vị chính xác điểm làm việc mà không bị sai số do độ rơ của bánh răng.

· Tuổi thọ và độ bền cao: Nhờ sự phân bố lực đều trên nhiều chốt cùng một lúc, các chi tiết ít bị mài mòn hơn so với bánh răng thông thường.

❰/Giải thích - Cycloidal drives❱

❰Giải thích - Quasi-Direct Drive (QDD)❱

Quasi-Direct Drive (QDD) là hệ thống truyền động sử dụng động cơ có mật độ mô-men xoắn cao kết hợp với hộp số có tỷ số truyền thấp (thường từ \(3:1\) đến \(10:1\)). Cấu trúc này mô phỏng các ưu điểm của động cơ truyền động trực tiếp (Direct Drive), giúp robot đạt được độ nhạy cao, phản hồi lực tốt và khả năng hấp thụ va đập ưu việt.

Tại sao QDD được sử dụng nhiều trong Robotics?

Trước đây, các khớp robot thường dùng động cơ tốc độ cao với hộp số tỷ số truyền lớn (VD: 50:1 trở lên) để tạo đủ lực, làm mất đi khả năng cảm nhận lực tự nhiên. QDD giải quyết bài toán này nhờ các đặc tính vượt trội:

· Khả năng quay ngược (Backdrivability): Cho phép các tác động từ bên ngoài (như lực đẩy, va đập) tác động ngược lại động cơ một cách an toàn. Điều này giúp robot dễ dàng thích nghi với các địa hình phức tạp, tránh hỏng hóc khi ngã.

· Hấp thụ va đập: Tỷ số truyền thấp kết hợp với quán tính phản xạ thấp giúp bảo vệ các bộ phận cơ khí, cho phép robot linh hoạt nhảy hoặc tiếp đất an toàn.

· Kiểm soát mô-men xoắn chính xác: Thay vì chỉ điều khiển vị trí, QDD cho phép kiểm soát lực/mô-men xoắn tại các khớp cực kỳ nhạy bén, nền tảng để robot di chuyển linh hoạt, uyển chuyển như con người hoặc động vật.

❰/Giải thích - Quasi-Direct Drive (QDD)❱

❰Giải thích - Series Elastic Actuators (SEA)❱

Series Elastic Actuators (SEA) hay cơ cấu chấp hành đàn hồi nối tiếp là một thiết bị truyền động trong robot, trong đó một thành phần đàn hồi (thường là lò xo) được đặt nối tiếp giữa động cơ và tải trọng của khớp nối.

Khác với các cơ cấu truyền động thông thường vốn cố gắng làm cho khớp robot cứng nhất có thể để đạt độ chính xác vị trí, SEA cố tình đưa độ đàn hồi vào hệ thống.

Cách thức hoạt động:

· Cơ chế này hoạt động dựa trên định luật Hooke: F = k.x

· Khi động cơ hoạt động, nó không tác động lực trực tiếp lên khớp mà kéo giãn hoặc nén lò xo trước.

· Bằng cách đo mức độ biến dạng của lò xo, hệ thống có thể tính toán chính xác lực hoặc mô-men xoắn mà robot đang tác dụng lên môi trường.

❰/Giải thích - Series Elastic Actuators (SEA)❱

❰Giải thích - Zero Moment Point (ZMP)❱

Zero Moment Point (ZMP) là một thuật ngữ quan trọng trong robot học, chỉ điểm trên mặt đất nơi tổng các mô-men lực quán tính và trọng lực triệt tiêu lẫn nhau. Khái niệm này là "chìa khóa" để tính toán quỹ đạo bước đi và giữ thăng bằng cho các robot hai chân (robot hình người).

Nguyên lý hoạt động cơ bản:

· Vị trí ZMP: Là điểm mà tại đó tổng lực tác động của trọng lực và mô-men quay không làm robot bị đổ.

· Điều kiện thăng bằng: Để robot không bị chúi về phía trước, ngả về phía sau hoặc đổ sang hai bên, điểm ZMP phải luôn nằm bên trong diện tích đa giác chân đế (vùng tiếp xúc giữa bàn chân robot và mặt đất).

Các giai đoạn bước đi tiêu biểu (Dựa trên ZMP)

Khi robot di chuyển, hệ thống điều khiển sẽ liên tục tính toán sự dịch chuyển của ZMP:

· Giai đoạn hai chân trụ (Double Support): Cả hai bàn chân đều chạm đất. ZMP được chuyển dần từ chân sau sang chân trước.

· Giai đoạn một chân trụ (Single Support): Một chân nhấc lên để bước tới, trọng lực dồn toàn bộ lên chân còn lại. Lúc này, ZMP phải được duy trì tuyệt đối trong phạm vi tiếp xúc của bàn chân đang bám đất.

❰/Giải thích - Zero Moment Point (ZMP)❱

❰Giải thích - Model Predictive Control (MPC)❱

Model Predictive Control (MPC) là phương pháp điều khiển tiên tiến sử dụng mô hình toán học để dự đoán các trạng thái tương lai của robot. Nó liên tục giải quyết một bài toán tối ưu hóa theo thời gian thực để tìm ra hành động tốt nhất, đảm bảo robot di chuyển trơn tru và tuân thủ các ràng buộc vật lý (như vận tốc, góc bẻ lái).

Nguyên lý hoạt động

Khác với các bộ điều khiển truyền thống (như PID) chỉ phản ứng với các sai số hiện tại, MPC hoạt động theo quy trình liên tục:

· Dự đoán: Dựa vào mô hình toán học của robot, MPC mô phỏng các hành động có thể xảy ra và dự đoán quỹ đạo di chuyển trong một khoảng thời gian ngắn (chân trời dự báo).

· Tối ưu hóa: Tìm ra chuỗi điều khiển tối ưu nhất (ví dụ: góc lái, lực momen) để robot đi đúng quỹ đạo đã định mà không vi phạm giới hạn phần cứng.

· Thực thi & Lặp lại: Áp dụng bước điều khiển đầu tiên cho robot, sau đó cập nhật dữ liệu cảm biến mới và lặp lại toàn bộ quá trình ở chu kỳ tiếp theo.

❰/Giải thích - Model Predictive Control (MPC)❱

❰Giải thích - Encoder❱

Encoder (bộ mã hóa) là thiết bị cảm biến cơ điện chuyển đổi chuyển động cơ học (góc quay hoặc tịnh tiến) thành tín hiệu điện. Trong robotics, nó hoạt động như "giác quan", giúp bộ điều khiển đo lường chính xác vị trí, tốc độ và hướng di chuyển của các khớp hoặc bánh xe.

· Absolute Encoder (Encoder tuyệt đối): Cung cấp mã vị trí độc nhất ngay khi khởi động. Robot luôn biết chính xác góc của khớp mà không cần phải quay về điểm gốc (Home).

· Incremental Encoder (Encoder tương đối): Đo lường chuyển động bằng cách tạo ra các xung khi trục quay. Cần phải thiết lập điểm mốc mỗi khi khởi động hệ thống.

❰/Giải thích - Encoder❱

❰Giải thích - Torque sensor❱

Torque sensors (cảm biến mô-men xoắn) là thiết bị chuyển đổi lực xoắn cơ học thành tín hiệu điện. Trong robotics, chúng đóng vai trò như "xúc giác", cho phép robot cảm nhận, đo lường và kiểm soát lực tác động hoặc lực xoay tại các khớp hoặc các trục chuyển động.

· Cảm biến mô-men xoắn tại khớp (Joint Torque Sensors): Đặt ở từng khớp của cánh tay robot. Cung cấp phản hồi chính xác về lực/mô-men đang tạo ra, giúp robot cảm nhận va chạm và tương tác an toàn.

· Cảm biến Lực/Mô-men xoắn đa trục (Force/Torque Sensors - F/T): Thường đặt ở cổ tay robot (vị trí gắn công cụ). Đo lường lực và mô-men xoắn theo cả 6 bậc tự do (F_x, F_y, F_z, M_x, M_y, M_z).

❰/Giải thích - Torque sensor❱

❰Giải thích - Power electronics❱

Power electronics (điện tử công suất) trong robotics là lĩnh vực ứng dụng các linh kiện bán dẫn (như MOSFET, IGBT) để biến đổi và điều khiển dòng điện công suất lớn. Đây chính là "hệ tuần hoàn" cung cấp và phân bổ năng lượng từ pin/nguồn điện đến các bộ phận chấp hành.

· Điều khiển động cơ: Chuyển đổi điện năng từ pin (DC) thành điện áp và dòng điện chính xác để điều khiển động cơ servo hoặc động cơ bước hoạt động trơn tru.

· Quản lý năng lượng: Tối ưu hóa việc sử dụng điện năng, giảm hao phí nhiệt, từ đó kéo dài tuổi thọ pin cho các thiết bị di động.

· Chuyển đổi đa dạng: Thực hiện các bước chuyển đổi quan trọng như AC-DC (sạc pin), DC-DC (hạ áp từ pin xuống mức điện áp cho vi điều khiển), và DC-AC (cho động cơ xoay chiều).

❰/Giải thích - Power electronics❱

❰Giải thích - CAN bus modules❱

CAN bus module (Controller Area Network) trong robotics là một thiết bị hoặc bo mạch phần cứng cho phép các bộ điều khiển (vi điều khiển, máy tính nhúng), cảm biến và động cơ giao tiếp với nhau qua một mạng truyền thông chung.

Khác với cách kết nối dây điểm-điểm truyền thống, CAN bus sử dụng một đường truyền (bus) duy nhất, giúp các thành phần truyền/nhận dữ liệu dễ dàng.

· Giảm thiểu hệ thống dây dẫn: Thay vì nối hàng chục dây tín hiệu chằng chịt về mạch điều khiển trung tâm, tất cả các module chỉ cần cắm chung vào một đường bus 2 sợi.

· Chống nhiễu xuất sắc: Được phát triển để ứng dụng trong môi trường công nghiệp và ô tô, chuẩn CAN hoạt động rất ổn định trước sự nhiễu điện từ từ các động cơ công suất lớn.

· Cấu trúc Multi-Master: Không cần một bộ xử lý trung tâm (CPU) duy nhất. Mọi thiết bị trên mạng đều có thể chủ động gửi dữ liệu và tự động phân xử (arbitration) nếu có nhiều thiết bị phát tín hiệu cùng lúc.

2026/06/21

☕ Nhàn đàm S&T: Humanoid Robots 🤖

Đề dẫn

❶. Humanoid Robots hoạt động thế nào?

1. Cấu trúc cơ học (phần “cơ thể”)

2. Cảm biến (phần “giác quan”)

3. Hệ thống điều khiển (phần “thân não”)

4. AI (phần “não bộ”)

5. Hệ thống năng lượng (phần “nguồn sống”)

6. Thăng bằng và chuyển động (phần khó nhất)

Tất cả hoạt động cùng nhau như thế nào?

Một cách hình dung đơn giản

❷. Lắp ghép một Humanoid Robot như thế nào?

❸. Huấn luyện Humanoid Robot làm việc

ⓐ. Nguyên lý điều khiển Humanoid Robot

ⓑ. Humanoid robot học việc như thế nào?

1. Học bắt chước (Điều khiển từ xa - Teleoperation)

2. Mô phỏng

3. Reinforcement Learning

4. Vision-Language-Action

5. Triển khai và tinh chỉnh tại chỗ (Edge Fine-Tuning)

🤔. Suy ngẫm chậm

✪

✪

Phụ lục

Phụ lục A: Danh mục vật tư để lắp ghép humanoid robot Atlas (Boston Dynamics)

1. Khung cơ khí (Structural Frame)

2. Hệ truyền động (Actuation System)

3. Tay và hệ thao tác vật thể

4. Hệ cảm biến

5. Hệ tính toán (Compute Stack)

6. Hệ nguồn năng lượng

7. Hệ phần mềm (Software Stack)

8. Ước lượng bậc tự do (DOF)

9. Ước lượng chi phí

Phụ lục B: Danh mục vật tư để lắp ghép humanoid robot Unitree H1

1. Khung cơ khí (Structural Frame)

2. Hệ truyền động (Actuation System)

3. Hệ cảm biến

4. Hệ tính toán (Compute Stack)

5. Hệ nguồn năng lượng

6. Dây dẫn và truyền tin

7. Hệ tản nhiệt

8. Software Stack

Chi phí sản xuất ước tính

Phụ lục C: Giải thích

❰Giải thích - DOF❱

❰/Giải thích - DOF❱

❰Giải thích - Reinforcement learning❱

❰/Giải thích - Reinforcement learning❱

❰Giải thích - PMSM❱

❰/Giải thích - PMSM❱

❰Giải thích - LiDAR 3D❱

❰/Giải thích - LiDAR 3D❱

❰Giải thích - Depth camera❱

❰/Giải thích - Depth camera❱

❰Giải thích - IMU❱

❰/Giải thích - IMU❱

❰Giải thích - Harmonic reducer❱

❰/Giải thích - Harmonic reducer❱

❰Giải thích - Cycloidal drives❱

❰/Giải thích - Cycloidal drives❱

❰Giải thích - Quasi-Direct Drive (QDD)❱

❰/Giải thích - Quasi-Direct Drive (QDD)❱

❰Giải thích - Series Elastic Actuators (SEA)❱

❰/Giải thích - Series Elastic Actuators (SEA)❱

❰Giải thích - Zero Moment Point (ZMP)❱

❰/Giải thích - Zero Moment Point (ZMP)❱

❰Giải thích - Model Predictive Control (MPC)❱

❰/Giải thích - Model Predictive Control (MPC)❱

❰Giải thích - Encoder❱

❰/Giải thích - Encoder❱

❰Giải thích - Torque sensor❱

❰/Giải thích - Torque sensor❱

❰Giải thích - Power electronics❱

❰/Giải thích - Power electronics❱

❰Giải thích - CAN bus modules❱

❰/Giải thích - CAN bus modules❱

☕ Nhàn đàm S&T: Humanoid Robots 🤖