Lĩnh vực chế tạo người máy ngày càng tiến bộ hơn, trong đó có robot cung cấp cho Rainbow Dash khả năng tự học cách đi lại. Mô hình robot bốn chân này có thể học cách đi lại và quay trái phải chỉ trong vài giờ. Các nhà nghiên cứu từ Google, Đại học California, Berkeley và Viện Công nghệ Georgia đã xuất bản một bài báo trên trang web ArXiv mô tả một công nghệ AI thống kê được gọi là học tăng cường sâu, họ sử dụng để tạo ra một thế hệ robot thông minh mới. Hầu hết các kỹ thuật tự học thông minh trước đây đều được thực hiện trong môi trường mô phỏng máy tính.
Tuy nhiên, Rainbow Dash sử dụng công nghệ này để học cách đi bộ trong môi trường vật chất thực tế. Ngoài ra, nó có thể làm điều này mà không yêu cầu cơ chế giảng dạy chuyên biệt (chẳng hạn như giảng viên hoặc dữ liệu được lập trình sẵn). Rainbow Dash đã bước đi thành công trên nhiều bề mặt, bao gồm cả đệm mút mềm và miếng đệm chân gấp khúc ngẫu nhiên.
Rainbow Dash học đi một cách “rất có chiến thuật”
Rainbow Dash có thể đi bộ trên nhiều bề mặt như tấm nệm xốp. Hoặc thảm lau chân với nhiều điểm gấp khúc ngẫu nhiên. Các kỹ thuật học sâu mà robot sử dụng bao gồm một loại học máy thử đúng và sai liên tục bằng cách tương tác nhiều lần với môi trường. Cách này tương tự như các trò chơi máy tính dùng phương pháp kỹ thuật số học cách chơi để giành chiến thắng.
Hình thức học máy này khác biệt rõ rệt với học tập có giám sát hoặc không giám sát truyền thống. Trong đó các mô hình học máy đòi hỏi dữ liệu đào tạo phải được phân định rõ ràng. Học tăng cường sâu kết hợp các phương pháp học tăng cường với học sâu. Trong đó quy mô của học máy truyền thống được mở rộng đáng kể. Bằng sức mạnh của các phép tính toán khổng lồ.
Mặc dù nhóm nghiên cứu cho rằng Rainbow Dash đã học cách tự đi lại. Sự can thiệp của con người vẫn đóng một vai trò quan trọng trong việc đạt được mục tiêu đó. Các nhà nghiên cứu đã phải tạo ra các đường ranh giới. Robot phải học cách đi bộ để giữ cho nó không rời khỏi khu vực. Họ cũng đã phải nghĩ ra các thuật toán cụ thể để ngăn robot rơi xuống. Một trong số đó là tập trung vào việc kìm hãm chuyển động của robot. Để ngăn ngừa tai nạn và thiệt hại do rơi xuống. Việc học tăng cường robot thường diễn ra trong môi trường kỹ thuật số. Trước khi các thuật toán được chuyển sang dạng vật lý để bảo vệ sự an toàn của robot.
Tổng kết
Thành công của Rainbow Dash đạt được sau khoảng một năm các nhà nghiên cứu. Tìm ra cách cho robot học môi trường vật lý thực tế thay vì dạng ảo như trước đây. Chelsea Finn, giáo sư trợ lý Stanford liên kết với Google nói: “Loại bỏ con người khỏi quá trình học tập của robot là điều thực sự khó khăn. Bằng cách cho phép robot học tự chủ, nó có thể hoạt động gần gũi hơn; với khả năng học sâu tăng cường trong thế giới thực”.