Trung Quốc vừa phát hành AI Agent nguy hiểm nhất từ trước đến nay.
Utar's 1.5, developed by Bite Dance, is an advanced visual language agent that revolutionizes GUI interaction by treating the entire screen as a single image.
Utar 1.5, được phát triển bởi Bite Dance, là một tác nhân ngôn ngữ hình ảnh tiên tiến cách mạng hóa tương tác GUI bằng cách coi toàn bộ màn hình như một hình ảnh duy nhất.
It features enhanced capabilities with models ranging from 2 billion to 72 billion parameters, advanced perception techniques, and a unified action space for seamless task execution.
Nó có các khả năng nâng cao với các mô hình từ 2 tỷ đến 72 tỷ tham số, các kỹ thuật nhận thức tiên tiến và một không gian hành động thống nhất cho việc thực hiện nhiệm vụ liền mạch.
The model learns from mistakes and demonstrates impressive performance benchmarks, achieving a 42.5% success rate in OS World challenges.
Mô hình học hỏi từ những sai lầm và thể hiện các tiêu chuẩn hiệu suất ấn tượng, đạt tỷ lệ thành công 42,5% trong các thử thách OS World.
Its open deployment encourages community engagement and innovation in GUI automation.
Việc triển khai mở của nó khuyến khích sự tham gia của cộng đồng và đổi mới trong tự động hóa GUI.
Th04 24, 2025