2018/12/27

☕ Nhàn đàm ICT: Xu thế STI tương lai 📈

Phác họa bài post:

Bài này nói về xu thế công nghệ trong tương lai – lấy từ quan điểm của OECD – gồm 40 công nghệ. Tuy nhiên, trong bài post này tôi chỉ đề cập đến 10 công nghệ chính, đó là:

1.       Internet of Things (Internet vạn vật);

2.       Big data analytics (Phân tích dữ liệu lớn);

3.       Artificial intelligence (Trí tuệ nhân tạo);

4.       Neurotechnologies (Công nghệ nơ ron);

5.       Nano/microsatellites (Vi vệ tinh);

6.       Nanomaterials (Vật liệu siêu nhỏ / Vật liệu nano);

7.       Additive manufacturing (Sản xuất đắp dần – hay còn gọi là in 3D);

8.       Advanced energy storage technologies (Công nghệ lưu trữ năng lượng tiên tiến);

9.       Synthetic biology (Sinh học tổng hợp); và

10.   Blockchain.

-

Trước hết xin giải nghĩa từ STI: là viết tắt của cụm từ: Science, Technology and Innovation – nghĩa là khoa học, công nghệ và đổi mới sáng tạo. Tôi mê cụm từ này vì nó gắn đổi mới sáng tạo với khoa học, công nghệ, lĩnh vực mà các anh/chị trên diễn đàn này đang theo đuổi.

Lại nói về các dịp cuối năm, truyền thông đại chúng thường có mục dự đoán tương lai trong năm tới sẽ “thịnh hành” cái gì. Họ thường đưa ra các con số chẵn kiểu như 10 xu hướng, 10 sự kiện, 10 cái này, 10 cái kia … Gần đây có thay đổi một chút là họ lấy con số cuối của năm để thay con số chẵn. Ví dụ, trước năm 2017 người ta dự đoán 7 sự kiện, trước năm 2018 người ta dự đoán 8 điểm nổi bật, …

Để góp cho diễn đàn đỡ trầm lắng, tôi bắt chước họ, trích từ tài liệu của OECD (The Organisation for Economic Co-operation and Development - http://www.oecd.org/) dự đoán xu thế công nghệ trong 10 - 15 năm tới. Không phải là năm sau mà những 10 đến 15 năm nữa cơ, dự đoán thế mới khó chứ😊 Mời các anh chị tham khảo 40 công nghệ thuộc 4 nhóm mà OECD cho rằng các công nghệ này sẽ được phát triển mạnh mẽ từ nay cho đến khoảng 10 -15 năm tới (danh mục nằm ở cuối bài viết này).

Cũng trong tài liệu đó, OECD đề cập đến 10 công nghệ được quan tâm hàng đầu:

1.       Internet of Things (Internet vạn vật);

2.       Big data analytics (Phân tích dữ liệu lớn);

3.       Artificial intelligence (Trí tuệ nhân tạo);

4.       Neurotechnologies (Công nghệ nơ ron);

5.       Nano/microsatellites (Vi vệ tinh);

6.       Nanomaterials (Vật liệu siêu nhỏ / Vật liệu nano);

7.       Additive manufacturing (Sản xuất đắp dần – hay còn gọi là in 3D);

8.       Advanced energy storage technologies (Công nghệ lưu trữ năng lượng tiên tiến);

9.       Synthetic biology (Sinh học tổng hợp); và

10.   Blockchain.

Các anh/chị lưu ý là tài liệu này xuất bản năm 2016, hơi cũ, có một số điểm sẽ kém phần thời sự, kém “hot” so với thời điểm này là thời điểm cuối năm 2018. Bây gờ chúng ta điểm qua 10 công nghệ theo số thứ tự như ở trên:

1. Vào thời điểm đó (2016), IoT (Internet of Things) được quan tâm hàng đầu vì người ta thấy tiềm năng ứng dụng của IoT trong y tế, trong sản xuất thông minh (Smart Manufacturing), trong quản lý tiêu thụ năng lượng (Energy systems), trong hệ thống giao thông (Transport systems), trong đô thị thông minh và hạ tầng đô thị (Smart cities and urban infrastructures) và trong chính quyền thông minh (Smart government). Tuy nhiên, sau khi vượt qua đỉnh “Hype Cycle”, một tài liệu của World Bank xuất bản vào đầu năm 2018, trong phần tổng quan, xin trích 2 quan điểm đối với IoT là “Unclear business models”, “Infrastructure a major barrier” – nghĩa là “mô hình kinh doanh chưa rõ ràng”, “hạ tầng còn là một rào cản lớn”. Các nhận định này có vẻ hơi thiếu lạc quan. Nhưng ai quan tâm đến IoT đều biết rằng truyền dẫn không dây trên diện rộng công suất thấp cho IoT còn là một chặng đường. Các đề xuất như LoRa, SigFox chưa phải là các chuẩn chung. Đề xuất chuẩn NB-IoT phụ thuộc vào sự phát triển mạng 5G. (Điểm khích lệ cho các fan của IoT: Trong một hội thảo gần đây do Ban Kinh tế Trung ương đứng ra tổ chức, Bộ Thông tin và Truyền thông có khẳng định là mạng 5G sẽ được thử nghiệm vào năm 2019 và sẽ thương mại hóa vào năm 2020 !?)

Xu thế ứng dụng IoT trên thế giới vào lĩnh vực nào? Theo một khảo sát trên 1.600 dự án IoT, xếp theo thứ tự cao đến thấp, IoT được ứng dụng vào các lĩnh vực sau:

Smart City (Đô thị thông minh)

Connected Industry (Công nghiệp kết nối)

Connected Building (Tòa nhà kết nối)

Connected Car (Xe hơi kết nối)

Smart Energy (Năng lượng thông minh)

Connected Health (Y tế kết nối)

Smart Supply Chain (Chuỗi cung ứng thông minh)

Smart Agriculture (Nông nghiệp thông minh)

Smart Retail (Bán lẻ thông minh)

2. Đứng thứ 2 là phân tích dữ liệu lớn (big data analytics) vì người ta tin rằng với các công cụ phân tích dữ liệu lớn, chúng ta sẽ biến các dữ liệu vô tri vô giác thành các thông tin có nghĩa và có giá trị. Phân tích dữ liệu lớn có thể được sử dụng để suy luận các mối quan hệ, thiết lập mối tương quan và thực hiện các dự đoán về kết quả và hành vi. Điều này đặc biệt đúng trong kinh doanh và phân tích hành vi người tiêu dùng. Càng ngày chúng ta càng thấy rõ rằng dữ liệu là một dạng tài sản, ai có nhiều dữ liệu, người đó càng giàu. Chả thế mà công ty VinaData đã tách ra từ VNG chỉ để quản lý dữ liệu! Trước đây chúng ta thường nghe các vụ bê bối về tìn cảm hay tiền bạc, nhưng gần đây chúng ta toàn nghe nói các vụ bê bối về dữ liệu! Xem thêm: https://vnexpress.net/so-hoa/10-vu-ro-ri-du-lieu-lon-nhat-the-gioi-nam-2018-3860123.html.

3. Đứng thứ ba trong tài liệu xuất bản năm 2016 nhưng đứng thứ nhất trên truyền thông năm 2018 là trí tuệ nhân tạo (AI). Có thể nói các hệ thống thông minh sử dụng kết hợp các phân tích dữ liệu lớn, điện toán đám mây, giao tiếp giữa máy-với-máy và Internet vạn vật (IoT) để vận hành và “tự học”. Trước đây cách tiếp cận AI thường thiên về “hệ chuyên gia” nhưng gần đây khi dữ liệu lớn có mặt ở khắp nơi thì cách tiếp cận chuyển hướng sang machine learning, deep learning. Điểm thú vị là machine learningdeep learning đều cần kiến thức cơ bản về toán, đặc biệt về đại số tuyến tính, xác suất, thống kê. Hy vọng đây là một điểm mạnh của người Việt !? 😊Một điểm thú vị khác, đó là machine learningdeep learning có mảnh đất ứng dụng lớn trong y học và sinh học. Điểm thú vị quan trọng nhất, theo tôi, đó là kỹ sư và sinh viên của chúng ta có thể tiếp cận machine learningdeep learning một cách dễ dàng vì có rất nhiều học liệu (cả miễn phí và có phí) trên mạng Internet.

4. Đứng thứ tư là công nghệ nơ ron (Neurotechnologies).

Neurotechnologies là gì vậy? Công nghệ nơ ron có thể được hiểu là phương tiện nhân tạo tương tác với não và hệ thần kinh. Điều này bao gồm, ví dụ, nghiên cứu não bộ; các thiết bị điện tử có thể sửa chữa hoặc thay thế các chức năng của não; thiết bị điều trị thần kinh được sử dụng để điều trị bệnh tâm thần; khớp thần kinh nhân tạo và mạng nơ ron cho giao diện não-máy tính; và sự phát triển của trí tuệ nhân tạo dành cho não bộ và hệ thần kinh.

Điểm đáng chú ý nhất của công nghệ này: vào một thời điểm nào đó, bộ não của người có thể liên kết với máy tính!? Và như vậy, bộ não sẽ được mở rộng, chẳng hạn như kết nối với Internet, kết nối với các hệ thống AI. Người nào cũng có hể trở thành “siêu nhân” khi được kết nối như vậy. Anh/chị có thể tham khảo thêm thông tin từ công ty neuralink (https://www.neuralink.com/) hoặc bài viết trên CNBC (https://www.cnbc.com/2018/09/07/elon-musk-discusses-neurolink-on-joe-rogan-podcast.html) viết về những ý tưởng “táo bạo và điên rồ” do Elon Musk khởi xướng.

5. Tiếp theo là Nano/microsatellites (Vi vệ tinh / vệ tinh nano). Vệ tinh loại lớn thường nặng hàng tấn và quay quanh quỹ đạo trái đất với độ cao 38.000 km, còn vệ tinh môi trường bay ở quỹ đạo thấp hơn – khoảng 500 km – có cân nặng khoảng dưới 500 kg. Vi vệ tinh chỉ nặng từ 1 – 50 kg. Trong khi vệ tinh lớn cần thời gian thiết kế và xây dựng mất từ vài năm đến hàng chục năm thì vi vệ tinh thì chỉ cần từ 10 ngày đến vài chục ngày. Chi phí để thiết kế và xây dựng 1 vi vệ tinh trong khoảng từ 200.000 đến 300.000 euros, tức là dưới 10 tỷ đồng. Chi phí để đẩy vi vệ tinh lên quỹ đạo mất khoảng 100.000 euros (dưới 3 tỷ đồng).

Vi vệ tinh có tác dụng gì? Vi vệ tinh dùng để quan sát mặt đất, ứng dụng trong truyền tin, trong khoa học, giáo dục và trong an ninh, quốc phòng. Nếu chúng ta có vi vệ tinh thì chúng ta có thể lấy ảnh vệ tinh trên cả nước, trong đó có biển đảo, theo tần suất hàng tuần, hàng tháng. Và như vậy chúng ta có thể ứng dụng vào quan trắc môi trường và biển đảo.

6. Nanomaterials (Vật liệu siêu nhỏ / Vật liệu nano). Vật liệu nano được định nghĩa là các vật liệu có kích thước từ 1 nm đến 100 nm (1 nm = 1 phần tỷ mét). Vật liệu nano có các thuộc tính quang học, từ tính và điện tính độc đáo có thể được khai thác trong các lĩnh vực khác nhau, từ chăm sóc sức khỏe đến công nghệ năng lượng.

Ứng dụng? Vật liệu nano được sử dụng trong quy trình sản xuất, sản phẩm và chăm sóc sức khỏe bao gồm sơn, bộ lọc, chất cách điện và chất phụ gia bôi trơn. Trong chăm sóc sức khỏe Nanozyme là vật liệu nano có đặc tính giống enzyme. Chúng là một loại enzyme nhân tạo mới nổi, đã được sử dụng cho các ứng dụng rộng rãi như sinh học, chẩn đoán khối u, kháng sinh, ... Trong sơn, vật liệu nano được sử dụng để cải thiện khả năng chống tia cực tím và cải thiện dễ lau chùi.  Bộ lọc chất lượng cao có thể được sản xuất bằng cấu trúc nano, những bộ lọc này có khả năng loại bỏ các hạt nhỏ kích cỡ như. Vật liệu nano đang được sử dụng trong các công nghệ cách nhiệt hiện đại và an toàn cho con người. Là phụ gia bôi trơn, vật liệu nano có khả năng giảm ma sát trong các bộ phận chuyển động.

Một trong những quan ngại khi sử dụng vật liệu nano là chúng quá bé và rất khó kiểm soát được chất lượng.

7. Additive manufacturing (Sản xuất đắp dần – hay còn gọi là in 3D). In ấn 3D hay công nghệ sản xuất đắp dần, là một chuỗi các công đoạn khác nhau được kết hợp để tạo ra một vật thể ba chiều. Trong in 3D, các lớp vật liệu được đắp chồng lên nhau và được định dạng dưới sự kiểm soát của máy tính để tạo ra vật thể. Các đối tượng này có thể có hình dạng bất kỳ, và được sản xuất từ một mô hình 3D hoặc nguồn dữ liệu điện tử. Máy in 3D là một loại robot công nghiệp. Có nhiều công nghệ khác nhau, như in li-tô lập thể (STL) hoặc mô hình hoá lắng đọng nóng chảy (FDM). Do đó, không giống một quy trình gia công loại bỏ vật liệu thông thường, in 3D hoặc sản xuất đắp dần một đối tượng ba chiều từ mô hình thiết kế có sự hỗ trợ của máy tính (CAD) hoặc tập tin AMF, thường bằng cách thêm vật liệu theo từng lớp.

In 3D ứng dụng vào đâu? Có thể kể ra: trang phục (may mặc, giày dép), xe máy, xây dựng, động cơ điện và máy phát điện, quân sự, y tế, máy tính và rô bốt, vũ trụ, nghệ thuật, thông tin – truyền thông, giáo dục, môi trường.

8. Advanced energy storage technologies (Công nghệ lưu trữ năng lượng tiên tiến). Công nghệ lưu trữ năng lượng có thể được định nghĩa là một hệ thống hấp thụ năng lượng và lưu trữ nó trong một khoảng thời gian trước khi tiêu thụ theo yêu cầu.

Các năng lượng tái tạo như ánh sáng mặt trời, gió và thủy triều thường không liên tục và không phải lúc nào cũng có thể dự đoán được. Công nghệ lưu trữ năng lượng có thể chia thành 3 loại theo giai đoạn như sau:

Loại trong giai đoạn R&D (nghiên cứu): flow batteries (pin chảy), flywheel (bánh đà), superconducting magnetic energy storage (lưu trữ năng lượng từ tính siêu dẫn), supercapacitor (siêu tụ điện), Advanced Adiabatic Compressed Air Energy Storage (Lưu trữ năng lượng không khí nén đáng tin cậy), hydrogen (khinh khí), synthetic natural gas (khí thiên nhiên tổng hợp), thermochemical (nhiệt hóa);

Loại trong giai đoạn trình diễn và triển khai: lithium based battery (ắc quy lithium), molten salt (muối nóng chảy), flywheel low speed (bánh đà tốc độ thấp), ice storage (kho đá băng), sodium sulphur batteries (pin lưu huỳnh natri), Compressed Air Energy Storage (Lưu trữ năng lượng khí nén), residential hot water heaters with storage (máy nước nóng dân dụng);

Loại đã được thương mại hóa: underground thermal energy storage (lưu trữ năng lượng nhiệt ngầm), cold water storage (trữ nước lạnh), pit storage (hầm chứa), pumped storage hydropower (bơm thủy điện lưu trữ).

9. Synthetic biology (Sinh học tổng hợp). Sinh học tổng hợp là một ngành liên ngành của sinh học và kỹ thuật: công nghệ sinh học, kỹ thuật di truyền, sinh học phân tử, kỹ thuật phân tử, sinh học hệ thống, khoa học màng, sinh lý học, kỹ thuật điện và sinh học, kỹ thuật điện và máy tính, kỹ thuật điều khiển và sinh học tiến hóa.

Sinh học tổng hợp tác động vào đâu? Có thể kể ra một vài hướng nghiên cứu và ứng dụng:

Biological computers (máy tính sinh học): Máy tính sinh học là hệ thống sinh học được thiết kế có thể thực hiện các hoạt động giống như máy tính - đây là một mô hình đầy hứa hẹn trong tương lai.

Biosensors (cảm biến sinh học): Cảm biến sinh học là một sinh vật nhân tạo, thường là vi khuẩn, có khả năng phát hiện sự hiện diện của kim loại nặng hoặc độc tố.

Cell transformation (biến đổi tế bào): Các tế bào sử dụng các gen và protein tương tác, được gọi là các mạch gen, để thực hiện chức năng đa dạng, như phản ứng với các tín hiệu môi trường, ra quyết định và giao tiếp. Ba thành phần chính có liên quan: DNA, RNA (axit ribonucleic) và các mạch gen được thiết kế có thể kiểm soát biểu hiện gen từ nhiều cấp độ bao gồm mức độ phiên mã, sau phiên mã và dịch mã.

Designed nucleic acid systems (hệ thống sửa đổi hệ thống axit nucleic): Các nhà khoa học có thể mã hóa thông tin kỹ thuật số thành một chuỗi DNA tổng hợp.

Synthetic life (sinh vật sống tổng hợp): Một chủ đề quan trọng trong sinh học tổng hợp là sinh vật sống “nhân tạo”, liên quan đến các sinh vật giả thuyết được tạo ra trong ống nghiệm từ các phân tử sinh học và các vật liệu thành phần của chúng.

Vấn đề đang được tranh cãi hiện nay liên quan đến sinh học tổng hợp là “đạo đức sinh học” và “an toàn sinh học”. Thực phẩm biến đổi gen là một ví dụ điển hình: tác dụng và tác hại của chúng chưa ai đảm bảo. Hay như sửa đổi gen: liệu nhân loại có tạo ra các sinh vật kỳ quái khác với tự nhiên hay không?

10. Blockchain. Gần đây, truyền thông đại chúng đề cập “quá nhiều” về blockchain. Năm 2018, blockchain được quan tâm một cách đặc biệt, chỉ đứng sau chủ đề trí tuệ nhân tạo. Có thể nói đề tài này đang ở đỉnh của “hype cycle”. Mặc dù vậy, người ta cho rằng blockchain hiện nay vẫn chỉ ở trạng thái “xanh”, chưa “chín” - phần lớn còn ở giai đoạn proof-of-concept (chứng minh ý tưởng). Tuy ở giai đoạn chưa chín muồi nhưng blockchain đã được nhiều đại gia công nghệ cung cấp dưới dạng dịch vụ: “blockchain as a service”. Đó là các công ty Microsoft, SAP, Oracle, Hewlett-Packard, Amazon và IBM.

Cho đến thời điểm này, những ứng dụng nào đã được nhận diện ngoài các ứng dụng gốc là tiền ảo (cryptocurrency), smart contracts và công nghệ tài chính (fintech)? Xin kể ra một vài ứng dụng:

Ứng dụng trong truy xuất nguồn gốc và quan trắc chuỗi cung ứng

Ứng dụng trong hệ thống quản trị doanh nghiệp (Enterprise Resource Planning Systems)

Ứng dụng trong in 3D (để bảo vệ quyền sở hữu trí tuệ)

Ứng dụng trong quản lý phụ tùng

Ứng dụng trong quản lý tài sản

Như đã hứa trong phần đầu của bài này, cuối cùng là danh mục 40 công nghệ thuộc 4 nhóm mà OECD cho rằng các công nghệ này sẽ được phát triển mạnh mẽ từ nay cho đến khoảng 10 -15 năm tới. Tôi để nguyên tiếng Anh để tránh việc có thể dịch không sát nghĩa.

Digital

1.       Cloud Computing

2.       Photonics and Light Technologies

3.       Blockchain

4.       Robotics

5.       Modelling Simulation and Gaming

6.       Quantum Computing

7.       Grid Computing

8.       Artificial Intelligence (AI)

9.       Internet of Things (IoT)

10.   Big Data Analytics

Energy + Environment

1.       Smart Grids

2.       Micro and Nano Satellites

3.       Precision Agriculture

4.       Biofuels

5.       Autonomous Vehicles

6.       Power Microgeneration

7.       Fuel Cells

8.       Advanced Energy Storage Technologies

9.       Drones

10.   Electric Vehicles

11.   Carbon Capture and Storage

12.   Photovoltaics

13.   Wind Turbine Technologies

14.   Hydrogen Energy

15.   Marine and Tidal Power Technologies

Advanced Materials

1.       Nano Materials

2.       Functional Materials

3.       Nano Devices

4.       Additive Manufacturing (3D Printing)

5.       Carbon nanotubes and Graphene

Biotechnologies

1.       Bioinformatics

2.       Personalized Medicine

3.       Stem Cells

4.       Health Monitoring Technologies

5.       Medical and Bioimaging

6.       Regenerative Medicine and Tissue Engineering

7.       Neuro Technologies

8.       Bio Catalysis

9.       Biochips and Biosensors

10.   Synthetic Biology

Post này đúng là lê thê dài dòng. Nhưng kỳ nghỉ này những 4 ngày cơ mà! Con cà con kê để anh/chị nhân đó mà “giết thời giờ” vào các vấn đề liên quan đến khoa học nghệ thay cho các bản tin “giật gân” của giới “showbiz” ! 😊

Chúc mừng năm mới 2019!

 

2018/09/01

☕ Nhàn đàm ICT: Machine Learning

Phác họa bài post:

1.       Machine Learning là gì?

2.       Quan hệ { đặc tính } => { nhãn }

3.       Tìm hàm F từ dữ liệu

4.       Đặc tính dự báo, phỏng đoán của Machine Learning

5.       Cách tiếp cận chính của Machine Learning

6.       Training

7.       Mô hình tuyến tính

8.       Mô hình phi tuyến: Neural Networks

9.       Ngôn ngữ lập trình nào phù hợp với Machine Learning?

10.   Framework nào phù hợp với Machine Learning?

11.   Có cần môn học Machine Learning?

-

Thoạt đầu tôi có ý định dịch ‘Machine Learning’ thành ‘Học máy’ hoặc ‘Máy học’ nhưng xem ra cả 2 lựa chọn này đều có một cái gì đó không ổn. Cuối cùng, để đỡ bị rơi vào cảnh chuyển câu câu chuyện ICT thành câu chuyện dịch thuật, tôi đành chấp nhận để nguyên trạng Machine Learning, hoặc viết tắt ML.

1. Thế Machine Learning là gì vậy? Tôi lang thang trên mạng Internet để tìm một định nghĩa về Machine Learning nhưng kết quả thu được các định nghĩa hoặc quá dài hoặc quá cô đọng đến mức trừu tượng khó hiểu. Tôi mạnh dạn đưa ra một cách diễn nôm: Machine Learning là hệ thống tìm cách kết hợp đầu vào để tạo ra các dự đoán đầu ra về dữ liệu chưa từng thấy trước đó.

1.a. Machine Learning là một môn khoa học về dữ liệu (Data Science): chỉ dựa đơn thuần vào dữ liệu để suy ra dữ liệu, chứ không dựa vào thuật toán;

1.b. Để tìm ra một quy tắc suy đoán input => output, Machine Learning phải dựa trên một mô hình và mô hình này phải được huấn luyện với một lượng lớn dữ liệu biết trước;

2. Đọc kỹ hơn một chút, tôi nhận thấy ML là mô hình xác định mối quan hệ giữa tập hợp các đặc tính (đầu vào) và các nhãn (đầu ra). Các nhãn có thể là giá trị hồi quy (liên tục) hoặc phân lớp (rời rạc). Công việc chính của ML là từ tập hợp một lượng lớn dữ liệu (đặc tính, nhãn) phải điều chỉnh mô hình sao cho quy tắc { đặc tính } => { nhãn } có sai số nhỏ nhất đối với các dữ liệu biết trước. Việc điều chỉnh mô hình này gọi là quy trình huấn luyện: máy tự học để tìm ra quy luật. Đây là gốc vì sao có từ Machine Learning.

3. Nói một cách toán học, nếu gọi y là nhãn và X là đặc tính thì vấn đề của ML là y = F(X). (Tôi viết hoa X vì X có thể nhiều biến x1, x2, …) Có vẻ như đơn giản quá, đúng không ạ? Vấn đề của Machine Learning là cho biết x, y với hàng chục ngàn, hàng trăm ngàn, hàng triệu, hàng tỷ bản ghi – công việc cần làm là tìm ra hàm F, sao cho y = F(X) đúng với mọi bản ghi cho trước. Quá khó. Vì F có vô vàn lựa chọn.

4. Vấn đề còn phức tạp hơn vì các bản ghi biết trước đó thường chỉ ghi lại các giá trị tương đối và có một lượng bản ghi (dù nhỏ) có dữ liệu không đáng tin cậy (gọi là dữ liệu nhiễu). Vì lý do này, cách huấn luyện để điều chỉnh mô hình thường là cách tiếp cận gần đúng, tìm sai số nhỏ nhất, chứ không theo cách tiếp cận chính xác hoàn toàn. Cách tiếp cận của Machine Learning thường là stochastic, theo phương pháp xác suất, thống kê, thay y = F(X) bằng y F(X). Nghĩa là nhãn đầu ra là kết quả “dự báo”, “phỏng đoán” của hàm các đặc tính.

5. Vậy hàm F phổ biến được dùng trong Machine Learning hiện nay là những dạng nào? Sau khi lục lọi trên mạng một hồi, tôi nhận thấy người ta chủ yếu tiếp cận bằng mô hình hàm tuyến tính hoặc mô hình mạng nơ ron (trong tiếng Anh: Neural Network hoặc Artificial Neural Network). Đặc điểm chung của 2 mô hình này là có các hệ số quyết định tính chất của mô hình. Ẩn số của mô hình là tìm ra các hệ số sao cho sai số giữa mô hình và bản ghi các dữ liệu biết trước là nhỏ nhất. Cách tính sai số thường dùng nhất là trung bình bình phương sai số (Mean Squared Error – MSE, xem https://en.wikipedia.org/wiki/Mean_squared_error).

6. Huấn luyện (Training): Thực chất đây là quá trình điều chỉnh mô hình sao cho sai số giữa đầu ra của mô hình so với đầu ra thực tế là nhỏ nhất. Mỗi một lần điều chỉnh (lần thử cho các hệ số), mô hình phải tính toàn bộ sai số của N bản ghi (N thường ở mức hàng chục nghìn đến hàng trăm nghìn). Nếu số lần điều chỉnh là hàng chục nghìn thì chúng ta thấy lượng tính toán thật là khổng lồ. Đây là một trong các lý do khiến Machine Learning gắn liền với dữ liệu lớn (Big Data).

6.1. Khi huấn luyện, một trong các vấn đề đặt ra là cần có thuật toán để “mò” được điểm sao cho sai số là nhỏ nhất. Thuật toán huấn luyện liên quan đến một số khái niệm như Gradient Descent, Learning Rate, Generalization (tổng quát hóa), Training & Test Sets (chia dữ liệu thành khối dùng để huấn luyện và khối dùng để kiểm tra lại mô hình), Validation, Representation, Regularization, … Điều này càng minh chứng rằng Machine Learning là một môn khoa học về dữ liệu.

6.2. Khi huấn luyện, một vấn đề nữa đặt ra là cách đối mặt với số lượng bản ghi lớn (hàng triệu, hàng tỷ bản ghi)? Người ta nhận thấy là khi số lượng bản ghi lớn thì có rất nhiều dữ liệu lặp, dư thừa (ví dụ tập hợp các bản ghi về đo chỉ số môi trường theo dõi trong một khoảng thời gian dài). Nếu chúng ta áp dụng điều chỉnh đến tất cả các bản ghi thì không những là mất rất nhiều thời gian cho tính toán mà còn là không cần thiết. Người ta thường chọn một tập bản ghi theo phương pháp ngẫu nhiên dùng để huấn luyện mô hình. Điều này, một lần nữa, minh chứng rằng Machine Learning liên quan chặt chẽ đến xác suất, thống kê.

6.3. Trong Machine Learning, mọi thứ phải đổi về thành những con số - vì việc điều chỉnh mô hình phải dựa trên các tính toán. Đây là một công đoạn rất mất thời gian và thường rất tinh tế trong việc tìm cách “ánh xạ” các giá trị văn bản thành các con số. Ví dụ, để “bói” tương lai của một người dựa trên ngày tháng năm sinh tính theo âm lịch của người đó thì phải tìm cách ánh xạ “ngày tháng năm sinh âm lịch” và “tương lai” thành những con số. Sau đó, thầy “Machine Learning” phải huấn luyện trên tập hợp khoảng vài triệu “hồ sơ cuộc đời” mới hòng đưa ra được một mô hình dùng để “bói”.

7. Mô hình tuyến tính: Đây là mô hình được nghiên cứu kỹ trong Machine Learning. Khi huấn luyện (điều chỉnh), kết quả thường hội tụ (tức là tìm ra được mô hình). Đây là một điểm rất quan trọng trong huấn luyện mô hình vì chúng ta biết là chúng ta sẽ tới đích. (Ngoài lề: trong cuộc sống, chúng ta vẫn thường gặp trường hợp chúng ta theo một mô hình nào đó mà không biết là có tới đích hay không 😊.) Trong Machine Learning, ngườif ta tìm cách tuyến tính hóa một số mô hình phi tuyến tính. Ví dụ, người ta tạo ra một đặc tính mới dựa trên việc nhân các đặc tính cũ với nhau. Đặc tính mới này có tên là đặc tính chéo (Cross Feature).

8. Mô hình mạng nơ ron (Neural Network): Có rất nhiều vấn đề không tuyến tính hóa được bằng cách tạo ra đặc tính chéo: nhận dạng hình ảnh, nhận dạng tiếng nói, dịch tự động… Cách tiếp cận chung của Machine Learning là theo mô hình mạng nơ ron. Mạng nơ ron của Machine Learning gồm một lớp đầu vào (Input Layer), một lớp đầu ra (Output Layer) và một hoặc nhiều lớp ẩn (Hidden Layer) ở giữa đầu vào và đầu ra. Hàm kích hoạt (Activation Function) từ lớp này sang lớp khác được chọn là các hàm phi tuyến tính như ReLU (rectified linear unit – chỉnh lưu tuyến tính), Sigmoid, … Hàm kích hoạt trong mạng nơ ron phải là hàm phi tuyến tính.

8.1. Deep Neural Network: Quan sát cấu trúc của mạng nơ ron chúng ta thấy các lớp kế tiếp nhau theo hình bậc thang, mỗi lớp kế tiếp sử dụng đầu ra từ lớp trước đó làm đầu vào. Khi số lớp nhiều lên thì người ta gọi là Deep Neural Network. Deep Neural Network là một dạng của Deep Learning.

8.2. Huấn luyện mô hình mạng nơ ron: Khi thiết kế mạng nơ ron, người ta phải quyết định có bao nhiêu lớp ẩn, mỗi lớp ẩn có bao nhiêu nơ ron và hàm kích hoạt nên chọn hàm nào (ReLU, Sigmoid, …). Huấn luyện mô hình mạng nơ ron đòi hỏi phải điều chỉnh mô hình bên cạnh việc điều chỉnh các tham số khác như Learning Rate, chọn Regularization, …

9. Ngôn ngữ lập trình nào phù hợp với Machine Learning? Đây là câu hỏi đặt ra một cách tự nhiên khi học hoặc nghiên cứu về Machine Learning. Python gần như là lựa chọn mặc nhiên (De Facto): Python có thể được sử dụng để xử lý dữ liệu lớn (Big Data) và thực hiện toán học phức tạp.

10. Framework nào phù hợp với Machine Learning? Tìm kiếm trên mạng sẽ cho chúng ta một kết quả dạng như sau:

1. TensorFlow (https://www.tensorflow.org/),

2. Caffe (http://caffe.berkeleyvision.org/),

3. Microsoft Cognitive Toolkit/CNTK (https://www.microsoft.com/en-us/cognitive-toolkit/),

4. Torch/PyTorch (http://torch.ch/, http://pytorch.org/),

5. MXNet (https://mxnet.apache.org/),

6. Chainer (https://chainer.org/),

7. Keras (https://keras.io/),

8. Deeplearning4j (https://deeplearning4j.org/)

Tôi khuyến nghị chọn TensorFlow vì TensorFlow được tạo ra bởi Google. Use case nổi tiếng nhất của TensorFlow là Google Translate. Ngoài ra TensorFlow có các khả năng như xử lý ngôn ngữ tự nhiên, phân loại văn bản / tóm tắt, nhận dạng giọng nói / hình ảnh / chữ viết tay, dự báo và gắn thẻ.

11. Có cần môn học Machine Learning? Nhân hôm nay là ngày khai giảng, chúng ta thử luận đàm xem Machine Learning có xứng đáng trở thành một môn học ở cấp đại học hay không? Cần quá đi chứ 😊. Trước đây và hiện nay các khoa (viện) CNTT vẫn thường có các môn như Ngôn ngữ lập trình/Thuật toán/Cấu trúc dữ liệu, Hệ điều hành, Truyền dữ liệu (Data Communications), Bộ giao thức TCP/IP, … thì trong tương lai gần chúng ta nên có môn học, theo tôi là nên đặt theo gốc: Machine Learning. Cũng có thầy/cô sẽ cho rằng nên để Machine Learning như là phân môn của nhận dạng. Tôi cho rằng Machine Learning nên thuộc vào môn khoa học hiện nay đang được cả thế giới quan tâm là Khoa học Dữ liệu (Data Science). Có người còn nói rằng Dữ liệu sẽ là một loại tiền tệ mới – người nào có càng nhiều dữ liệu thì người đó càng giàu 😊?!

 

2018/03/27

☕ Nhàn đàm ICT: Bitcoin, Blockchain & Satoshi Nakamoto ₿

1. Ngược dòng thời gian, năm 1998, W. Dai viết một bài ngắn có tên là “b-money” nói về ý tưởng một loại tiền ảo, tiền mật mã “cryptocurrency” trên mạng Internet (http://www.weidai.com/bmoney.txt). Mười năm sau, một người với danh xưng là Satoshi Nakamoto viết một bài khác với tựa đề “Bitcoin: A Peer-to-Peer Electronic Cash System” (https://bitcoin.org/bitcoin.pdf). Bài khá ngắn, 9 trang kể cả 1 trang tham chiếu, 12 mục cô đọng và chỉ gửi lên mailing list. Bài này đề xuất việc xây dựng hệ thống tiền ảo bitcoin.

2. Trong hệ thống này, người mua và người bán thanh toán, “chuyển khoản” trực tiếp cho nhau mà không cần trung gian. Việc định danh sử dụng phương pháp Private – Public Key (mỗi chủ nhân giữ một cặp chìa khóa gồm chìa khóa bí mật: private key và chìa khóa công khai: public key). Trong mật mã thì phương pháp này cho đến thời điểm hiện nay chưa ai công bố được phương án “phá” khóa cả. Như vậy việc định danh đã được giải quyết.

3. Bảo mật giao dịch: cũng không thành vấn đề vì với phương pháp Private – Public Key người ta dễ dàng gửi thông điệp cho nhau một cách bí mật, chỉ có người gửi và người nhận biết với nhau.

4. Thách thức lớn nhất là làm thế nào để giải quyết vấn đề “double spending”: nghĩa là cùng một lượng tiền người ta chi trả nhiều lần cho nhiều người thì sao? Satoshi Nakamoto cho rằng cách duy nhất để giải quyết vấn đề này là tất cả các bên tham gia đều có sổ cái (ledger) ghi lại toàn bộ các giao dịch. Ai cũng có sổ cái và tất cả các sổ cái đều giống nhau. Hệ thống hoạt động dựa trên mạng lưới các “nút” (node) giao dịch trên mạng. Các nút này thực chất là các máy tính có kết nối Internet.

5. Blockchain: Satoshi Nakamoto đưa ra một ý tưởng mới gọi là block chain (trong bài báo, hai từ này được viết rời nhau). Có thể tạm dịch nghĩa của khái niệm này là “các khối xâu chuỗi với nhau”. Các khối này liên kết với nhau theo trục thời gian: cứ khoảng 10 phút sinh ra một khối mới. Khối sau được sinh ra liên kết với tất cả các khối trước đó theo một quy tắc nhất định, chứ không phải sinh ra một cách bất kỳ. Tất cả các giao dịch mới đều được đặt vào khối mới phát sinh này. Chúng ta sẽ thấy rằng khối mới được sinh ra là kết quả của cuộc cạnh tranh “khốc liệt” giữa các nút.

6. Vấn đề phát hành bitcoin: đúc tiền ảo, mining. Vậy bitcoin được sinh ra như thế nào? Đây là vấn đề hấp dẫn, đúng không ạ? Satoshi Nakamoto quy định là người tìm ra khối mới sẽ được “thưởng” một lượng tiền ảo nhất định. Trong thời gian 4 năm đầu tiên, mỗi một khối mới được thưởng 50 bitcoins. Bốn năm tiếp theo lượng thưởng giảm đi một nửa: 25 bitcoins, bốn năm tiếp theo sau giảm đi tiếp một nửa, chỉ còn 12.5 bitcoins, … Với quy tắc này thì số bitcoins không bao giờ vượt quá 21 triệu. Nó cũng giống như kim loại quý trên trái đất, chỉ là một lượng hữu hạn thôi chứ 😊. Quá trình “ganh đua nhau” tìm ra khối mới còn được gọi là mining, tạm dịch là “đào mỏ”.

7. Bảo vệ mạng lưới, chống bị tấn công bằng phương pháp mật mã hashcash. Hàm hash là hàm số “băm” một chuỗi bất kỳ và cho kết quả là một chuỗi có độ dài cố định (ví dụ 32 bytes). Hàm ngược: cho biết kết quả băm, việc tái tạo lại chuỗi đã bị băm là không khả thi. Trong blockchain, Satoshi Nakamoto dùng phương pháp mật mã hashcash. Phương pháp này độc đáo ở chỗ: khối sau là kết quả “băm” của tổ hợp của khối ngay phía trước và một số có tên gọi là nonce (tam dịch nonce: độc số). Kết quả băm này phải nhỏ hơn một “ngưỡng” nào đấy. Thực chất của việc này là tăng dần số nonce, thực hiện hàm băm và xem xem kết quả đã nhỏ hơn ngưỡng chưa. Satoshi Nakamoto gọi quá trình là proof-of-work (tạm dịch: chứng minh nỗ lực). Khi chạy trong thực tế các nút phải cạnh tranh xem ai là người đầu tiên tìm ra kết quả băm theo quy định. Người ta chứng minh rằng “ngưỡng” càng nhỏ thì việc tìm ra kết quả càng khó. Các tài liệu trên mạng gọi đây là độ khó (dificulty).

Tác dụng của phương pháp hashcash là gì? Nếu có một kẻ tấn công muốn thay đổi một giao dịch nào đó từ khối K nằm ở giữa chuỗi thì kẻ đó bắt buộc phải tính lại toàn bộ các khối tiếp theo K+1, K+2, … và tổng hợp thời gian tính toán phải nhỏ hơn các nút trên mạng chỉ tính toán cho khối cuối cùng. Xác suất này, theo Satoshi Nakamoto, tiệm cận đến 0 khi chuỗi blockchain đủ dài.

8. Trên mạng hiện nay có bao nhiêu nút? Đây lại là một câu hỏi “tò mò và thú vị”, đúng không ạ? Mời các anh/chị xem kết quả tại đường dẫn này: https://bitnodes.earn.com/. Chú ý rằng số nút “đang chạy” không cố định vì trong thiết kế của Satoshi Nakamoto cho phép một số nút offline một thời gian, sau đó lại online. Cả thế giới có khoảng hơn 12,000 nút. Việt Nam có hơn một chục nút. Mỹ có khoảng 3,000 nút, Đức và Trung Quốc mỗi nước có khoảng 2,000 nút, các nước khác có số nút ít hơn 1000.

9. Hiện nay blockchain có bao nhiêu khối và khối đầu tiên xuất phát vào thời điểm nào? Theo thiết kế, cứ 10 phút sinh ra một khối mới và anh/chị có thể xem số khối bằng đường dẫn: https://blockexplorer.com/api/status?q=getBlockCount, khoảng hơn 515,200 (tại thời điểm bài viết này).

Thế còn khối đầu tiên của blockchain được sinh ra vào lúc nào? Đó là vào lúc 18:15 ngày 3/1/2009. Khối này có tên gọi “genesis block”: khối khởi nguyên. Câu mà Satoshi Nakamoto ghi trong văn bản của khối này là: “The Times 03/Jan/2009 Chancellor on brink of second bailout for banks.” Câu này đóng dấu thời gian (3/1/2009) và một bình luận mang tính giễu cợt ngân hàng dự trữ.

10. Giá của một bitcoin (₿) là bao nhiêu? Vì bitcoin đã trở thành tiền tệ được dùng ở nhiều nước, nhiều nơi nên bitcoin có tỷ giá chuyển đổi như các loại tiền tệ khác. Ví dụ, vào thời điểm của bài viết này giá của một bitcoin là 183,623,634.04 VND và 8056.50 đô la Mỹ. Trong thời gian đầu sau khi đưa hệ thống vào hoạt động, Satoshi Nakamoto đã đào khoảng 1 triệu bitcoin. Như vậy Satoshi Nakamoto đang là tỷ phú đô la, có tài sản vào khoảng 8 tỷ đô 😊.

11. Tấm màn bí ẩn xung quanh Satoshi Nakamoto. Thông tin về tác giả của bitcoin vẫn còn mơ hồ. Sau khi khởi tạo hệ thống và “đào” khoảng 1 triệu bitcoins, Satoshi Nakamoto bàn giao dự án cho Gavin Andresen và dần biến mất. Satoshi Nakamoto tự khai là sống ở Nhật Bản và sinh ngày 5 tháng 4 năm 1975. Rất nhiều người cho rằng Satoshi Nakamoto phải có gốc Anh hoặc Mỹ vì tiếng Anh như người bản địa (qua phân tích các bài thảo luận trên mailing list). “Thuyết âm mưu” nói rằng ngay ngày sinh được khai cũng không phải vô tình. Vào ngày 5 tháng 4 năm 1933, Tổng thống Hoa Kỳ Franklin D. Roosevelt đã ký hai sắc lệnh hành chính: 6101 của Tổ chức Bảo tồn Dân sự và 6102 ngăn cấm việc tích trữ vàng, vàng miếng và giấy chứng nhận vàng của người Mỹ. Sau đó, năm 1975, quyền sở hữu vàng được tái cấp trở lại.

Biết đâu Satoshi Nakamoto ngồi ở một góc nào đó và cười thầm vì thiên hạ đoán già, đoán non về mình.

12. Blockchain có thể dùng vào việc gì? Dù Satoshi Nakamoto đã rút lui vào bóng tối, di sản mà Satoshi Nakamoto để lại là blockchain có tiềm năng ứng dụng trong nhiều lĩnh vực. Blockchain tạo cơ chế giao dịch không cần trung gian và không biên giới. Trên mạng họ kể ra rất nhiều. Ví dụ: hợp đồng bất động sản, hồ sơ bệnh án, truy xuất nguồn gốc, bỏ phiếu, quản lý ký kết hợp đồng, trong kế toán/kiểm toán, trong ngân hàng, trong hồ sơ sở hữu trí tuệ, … Thậm chí, Diễn đàn kinh tế thế giới còn dự đoán đến năm 2025, 10% GDP thế giới sẽ được lưu trong các blockchain 😊.

Bắt chước bài viết của Satoshi Nakamoto, tôi cũng hầu chuyện anh/chị bằng 12 mục. Tất nhiên 12 mục của Satoshi Nakamoto có thể tạo ra bước ngoặt trong ICT của thế giới, còn 12 mục của tôi như một chút gia vị trong cà phê sáng của anh/chị thôi 😊.

 

2018/03/21

IOCV Simulation 2018: IOCV aqu@farming Platform

 Đề bài của nhóm Simulation gửi cho cộng đồng IOCV (IoT Open Community for Vietnam).

Ngày đăng: 21-03-2018.

IOCV aqu@farming Platform

Sau đây là mô tả ứng dụng đặt ra cho IoT Open Community do nhóm Mô phỏng chuẩn bị. Đầu mối của nhóm Mô phỏng là VCCI-ITB. Góp ý và phản biện, vui lòng gửi đến contact@itb.com.vn hoặc levanloi@itb.com.vn

2018

Trong hệ sinh thái của IoT Open Community, nhóm Mô phỏng có nhiệm vụ đặt ra các vấn đề cần nghiên cứu dựa trên yêu cầu của nhóm Kinh doanh và nhóm Thị trường.

Vì vậy, để định hướng nghiên cứu năm 2018, nhóm Mô phỏng nêu vấn đề số 2, ứng dụng cho ngành nuôi trồng thủy sản, đặt tên ứng dụng là IOCV Aqu@Farming Platform.

 

Đặt vấn đề:

Đề bài của IOCV Aqu@Farming Platform là xây dựng một platform (nền tảng) nhằm hỗ trợ việc nuôi trồng thủy sản trong các ao, đầm cho các loài đang được nuôi trồng phổ biến hiện nay tại Việt Nam (tôm sú, tôm chân trắng, cá tra). Platform được xây dựng trên nền Cloud Computing (điện toán đám mây) để có khả năng hỗ trợ số lượng bất kỳ các ao nuôi.

Mỗi một ao nuôi là một đơn vị (Unit) trong Aqu@Farming Platform. Một Unit gồm bộ thu thập dữ liệu (Data Collector), bộ điều khiển chấp hành (Actuator Control Module), bộ quan trắc trên nền trí tuệ nhân tạo (AI based Monitoring Module). Ngoài ra, một Unit có thể có thêm các bổ sung tùy biến (Add-on): phác đồ canh tác (Cultivation Regimen), quản trị hệ thống (System Settings).

Mối liên kết được thể hiện như trong hình vẽ sau:



Diễn giải

  • IOCV Aqu@Farming Platform: hỗ trợ việc nuôi trồng thủy sản trong một ao nuôi (Pond). Ý tưởng chính là thường trực đo các cảm biến để quan trắc chất lượng nước trong ao nuôi. Nếu chất lượng nước ao nuôi có vấn đề thì lập tức gửi cảnh báo đến người có trách nhiệm và tự động điều khiển các cơ cấu chấp hành nếu có (sục nước, bơm nước, hút nước). Để đảm bảo có thể mở rộng ứng dụng cho số lượng các ao nuôi bất kỳ, ứng dụng được khuyến nghị xây dựng trên nền điện toán đám mây (Cloud Computing).
     
  • Pond: Ao nuôi trồng thủy sản. Mỗi một ao nuôi trồng thủy sản có một mã số riêng trên IOCV Aqu@Farming Platform. Mã số của ao nuôi được thiết kế theo chuẩn quốc gia (do Bộ NN&PTNT quy định), dễ dàng nhận biết được vị trí địa lý trên bản đồ. Mỗi một mã số gắn với các thuộc tính như chủ sở hữu ao nuôi, diện tích, loài thủy sản nuôi trồng, …

    Giả thiết cho mô phỏng này là các ao nuôi đều có một bộ thu dữ liệu đo và một bộ điều khiển chấp hành. Bộ thu dữ liệu đo và bộ điều khiển chấp hành đều được gắn với Internet.
     
  • Data Collector: Bộ thu thập dữ liệu đo các cảm biến chất lượng nước trong ao nuôi. Cần ít nhất các cảm biến sau:
    - nhiệt độ,
    - pH,
    - ORD (điện thế oxy hóa khử - Oxidation-Reduction Potential)
    - DO (oxy hòa tan) và
    - Turbidity (độ đục).

    Các cảm biến có thể để vào một hoặc 2 khối đầu đo cho một điểm đo. Tùy theo topology và diện tích của ao nuôi, ao nuôi có thể có nhiều hơn một điểm đo. Các giá trị cảm biến được truyền về cơ sở dữ liệu (CSDL) của IOCV Aqu@Farming Platform một cách định kỳ. Nếu đo tự động thì kỳ đo có thể là 30 phút. Nếu đo thủ công thì một ngày nên đo từ 2 đến 4 lần.

    Dữ liệu từ bộ thu được truyền về CSDL có thể theo nhiều cách: qua WiFi, qua GSM (2G, 3G, 4G, 5G) và có thể nhập thủ công bằng một giao diện phần mềm (trong trường hợp đo thủ công).
     
  • Databases: Cơ sở dữ liệu (CSDL). Trên IOCV Aqu@Farming Platform mỗi một ao nuôi có một CSDL riêng, gắn liền với mã số của ao nuôi. Các CSDL đều được lưu trên nền điện toán đám mây (Cloud Computing) để có khả năng mở rộng (scale-up) với số lượng ao bất kỳ. CSDL gồm các khối:
    - Thông tin quản lý hệ thống,
    - Lưu ký số đo từ các cảm biến,
    - Lưu ký các lần điều khiển bộ chấp hành,
    - Thông tin về phác đồ canh tác,
    - Các thông tin khác.
     
  • AI Based Monitoring: Bộ quan trắc trên nền trí tuệ nhân tạo. Bộ quan trắc được thiết kế hiển thị dữ liệu các cảm biến (nhiệt độ, pH, Do và độ đục) trên trang web (cho PC), trên apps (cho Smartphone và máy tính bảng).

    Ngoài ra, bộ quan trắc còn có các chức năng quan trọng khác:
    - Cảnh báo: Bộ quan trắc khi nhận thấy có dấu hiệu bất thường về môi trường (mức vàng, mức đỏ) sẽ gửi SMS và email đến một danh sách đăng ký từ trước. Thuật toán dùng để đưa ra mức cảnh báo, từ đơn giản đến phức tạp. Đơn giản nhất là so sánh vượt ngưỡng. Mức trung bình là thuật toán so sánh ngưỡng nhưng theo các khoảng thời gian trong ngày và theo mùa. Thuật toán tinh tế hơn là hệ chuyên gia dựa trên tổng hợp các quy tắc do các chuyên gia đưa vào. Thuật toán hoàn chỉnh hơn có thể là trí tuệ nhân tạo dựa trên quá trình học máy (machine learning).
    - Điều khiển cơ cấu chấp hành: Bộ quan trắc cũng có thể tham gia vào việc đóng/mở cơ cấu chấp hành (tùy theo cài đặt hệ thống).
     
  • Actuator Control: Bộ điều khiển chấp hành. Bộ chấp hành gồm máy sục khí, máy bơm (để bơm vào hoặc hút nước ra khỏi ao), các bộ cảnh báo (âm thanh, ánh sáng).
     
  • Cultivation Regimen: Phác đồ canh tác: ghi và nhắc các thời điểm từ lúc thả giống đến lúc thu hoạch.
     
  • System Settings: Quản trị hệ thống: liên quan đến cài đặt các tham số, lưu ký lỗi – rối của hệ thống, …

 

Nhận diện thách thức công nghệ

  • Dữ liệu lớn (Big Data): Thách thức công nghệ đầu tiên là dữ liệu lớn. Có các vấn đề có thể phát sinh dữ liệu lớn gồm: số lượng ao nuôi bất kỳ, tần suất đo dữ liệu là bất kỳ.

    Dữ liệu lớn có nghĩa là chúng ta không biết được giới hạn trên về dung lượng chứa dữ liệu. Cũng có thể ít nhưng cũng có thể rất nhiều, tùy theo mức độ phát triển của hệ thống. Giải pháp cho dữ liệu lớn hiện nay là Cloud Computing.
     
  • An toàn, an ninh thông tin (Data Security): Thách thức công nghệ tiếp theo là vấn đề an ninh, an toàn thông tin. An toàn: dữ liệu không chấp nhận bị mất vì hệ thống phải hoạt động liên tục và lưu ký quá khứ. An ninh: hệ thống tránh ở mức cao nhất bị hacker tấn công. An ninh, an toàn thông tin là một thách thức rất lớn, đặc biệt trong IoT.

    Giải pháp thông thường cho an toàn thông tin là replication ở mức cao (từ 3 trở lên). Giải pháp cho an ninh thông tin phải dựa vào đầu tư bảo mật hạ tầng và có đội ngũ thường trực để phòng ngừa, chống bị tấn công. Khi sự cố xảy ra thì phải có đội ngũ giải quyết sự cố.
     
  • Đo dữ liệu cảm biến trực tuyến: Các bộ cảm biến về môi trường nước được đặt trong môi trường nước. Muốn có dữ liệu trực tuyến, liên tục thì chúng ta cần đặt chúng trong nước một cách thường trực và phải có hệ điều hành + phần mềm đo dữ liệu và truyền dữ liệu về trung tâm.

    Giải pháp thông thường cho đo dữ liệu cảm biến trực tuyến là sử dụng hệ thống nhúng (embedded system). Hệ thống nhúng thường tích hợp tất cả mọi thứ lên một chip (SoC). Các thách thức là độ bền của pin nuôi hệ thống, môi trường truyền dẫn (thường là không dây) và môi trường cần đo (trong trường hợp này là nước).

    Nếu pin cần phải nạp lại trong khoảng thời gian dưới 1 tháng thì hệ thống nhúng ít có ý nghĩa trong thực tế.

    Nếu môi trường truyền dẫn không dây chỉ trong phạm vi 100m thì hệ thống cũng ít có ý nghĩa thực tế via các hồ nuôi có phạm vi lớn hơn nhiều.


     

Khuyến nghị

Đầu mối

Để xây dựng platform, nhóm Mô phỏng đề xuất các đầu mối về công nghệ, đầu mối về đơn vị nuôi trồng thủy sản, đầu mối về cung cấp thiết bị đo, đầu mối về cung cấp thiết bị chấp hành và đầu mối về cơ quan có thẩm quyền quản lý nuôi trồng thủy sản.

  • Đầu mối công nghệ: Là đơn vị thuộc cộng đồng IOCV (đăng ký làm đơn vị đầu mối với VCCI-ITB)
  • Đầu mối về nuôi trồng thủy sản: Tìm các đơn vị nuôi trồng thủy sản: nuôi tôm sú, nuôi tôm chân trắng và nuôi cá tra. VCCI-ITB phối hợp với đơn vị đầu mối (đã đăng ký với VCCI-ITB) để lập mạng lưới các đơn vị nuôi trồng thủy sản trên địa bàn cả nước.
  • Đầu mối về cung cấp thiết bị đo: Tìm các đơn vị bán các thiết bị đo có thể truyền dữ liệu qua WiFi, GSM (2G, 3G).
  • Đầu mối về cung cấp thiết bị chấp hành: Tìm các đơn vị bán các thiết bị máy sục khí, máy bơm, các thiết bị cảnh báo có bộ phận điều khiển có thể chấp nhận điều khiển từ các hệ vi xử lý.
  • Đầu mối về cơ quan có thẩm quyền quản lý nuôi trồng thủy sản: Tổng cục Thủy sản (thuộc Bộ Nông nghiệp và Phát triển Nông thôn).
  • Website mô phỏng: aqua.iocv.vn

Khuyến nghị giải pháp công nghệ

Hoạt động

  • Nghiên cứu xây dựng platform: Đơn vị đầu mối công nghệ & VCCI-ITB
  • Truyền thông về mô hình: Tổ chức 1 hội thảo tại vùng Đồng bằng Sông Cửu Long để giới thiệu giải pháp

Đầu tư

  • Giai đoạn 1: Đầu tư theo hình thức tự bỏ nguồn lực (đơn vị đầu mối công nghệ)
  • Giai đoạn 2: Triển khai thử nghiệm và mô phỏng (đơn vị đầu mối công nghệ và cộng đồng IOCV, mạng lưới các đơn vị nuôi trồng thủy sản, mạng lưới các nhà cung cấp thiết bị đo và thiết bị điều khiển)
  • Giai đoạn 3: Huy động vốn từ các quỹ nghiên cứu khoa học công nghệ (chủ yếu từ Bộ KH&CN) và các quỹ đầu tư mạo hiểm (Venture Capital)

Triển khai

Triển khai theo hình thức Showcase của IOCV.

 

Định nghĩa về Showcase

Ý tưởng (Concept Notes)

Đối với các vấn đề công nghệ liên quan đến IoT mà Chính phủ, doanh nghiệp và người dân đang quan tâm, cộng đồng IOCV tập trung nguồn lực bằng cách tạo ra Showcase (Điển hình).

Điển hình là một doanh nghiệp thành viên, thành viên này hoàn toàn tự nguyện. Điển hình sẽ đặt ra các vấn đề cho cộng đồng IOCV và cam kết làm “thí nghiệm” cho IOCV giải các vấn đề đó.

Các doanh nghiệp trong cộng đồng sẽ soi vào Điển hình, rút ra các bài học về thành công hoặc thất bại. Đối với trường hợp thành công thì Điển hình sẽ là tấm gương cho các doanh nghiệp khác làm theo. Đối với trường hợp thất bại, cộng đồng sẽ tránh được các cạm bẫy khi đầu tư.

Các nhóm trong IOCV sẽ liên kết với Điển hình lên chương trình hành động cụ thể. Cuối năm, tại Hội nghị G9 lần 2, Điển hình và các nhóm báo cáo, đánh giá kết quả và cấp chứng thực PoC (Proof-of-Concept) cho các sản phẩm đã áp dụng thành công vào Điển hình.

Khi thành công, Điển hình sẽ được nhân rộng và tạo ra một thị trường cho IOCV.

Quyền của Điển hình (Showcase’s Rights)

Quyền ra đề bài: Đơn vị điển hình có quyền ra đề bài, thông thường dưới dạng một đề tài hoặc dự án. Các đề tài/dự án này được mã hóa để cộng đồng tiện theo dõi. Nội dung đề bài được trình bày ngắn gọn để cộng đồng dễ tiếp cận. Khi có thành viên trong cộng đồng đăng ký thực hiện thì Điển hình và đơn vị thực hiện có mô tả chi tiết. Bản mô tả chi tiết được gọi là đặc tả.

Quyền đánh giá kết quả: Điển hình trực tiếp đánh giá kết quả thực hiện của đơn vị đăng ký. Chứng thực PoC (Proof-of-Concept) sẽ lấy đề xuất từ điển hình. Việc đánh giá kết quả sẽ căn cứ theo thiết kế chứng thực PoC. Thiết kế chứng thực PoC sẽ được đơn vị đầu mối là VCCI-ITB trình cộng đồng để lấy ý kiến và thống nhất quy chuẩn.

Trách nhiệm của Điển hình (Showcase’s Responsibilities)

Trách nhiệm thí nghiệm: Điển hình cam kết một cách tự nguyện làm thí nghiệm cho đề tài/dự án và là địa chỉ ứng dụng đầu tiên cho đề tài/dự án đó. Điển hình sử dụng nguồn lực của mình (nhân lực, tài lực, vật lực) để tạo điều kiện cho đơn vị đăng ký đề tài/dự án thực hiện. Điển hình đồng thời thử nghiệm kết quả của đề tài/dự án theo tiến độ đã thống nhất với đơn vị đăng ký, giám sát và đốc thúc tiến độ của đề tài/dự án.

Trách nhiệm showcase: Điển hình cam kết một cách tự nguyện cung cấp nguồn lực để giới thiệu và/hoặc demo kết quả của đề tài/dự án. Điển hình đồng thời cũng có trách nhiệm rút ra các bài học thành công và bài học thất bại. Các bài học thành công sẽ được nhân rộng cho cộng đồng doanh nghiệp trong cả nước. Bài học thất bại giúp cộng đồng tránh các bẫy đầu tư. Ngoài ra, điển hình còn có trách nhiệm báo cáo tại các Hội nghị G9.

☕ Nhàn đàm S&T: Humanoid Robots 🤖

Phác họa bài post: Đề dẫn. ❶. Humanoid Robots hoạt động thế nào? ❷. Lắp ghép một Humanoid Robot như thế nào? ❸. Huấn luyện Humano...