Google 於 10 月 7 日發布 Gemini 2.5 Computer Use 模型,這款基於 Gemini 2.5 Pro 視覺理解和推理能力開發的專門模型,讓 AI 代理能夠像人類一樣操控用戶介面。 該模型在多個網頁和流動裝置控制基準測試 ...
Gemini 2.5 Computer Use model 以 Gemini 2.5 Pro 的視覺理解與推理能力為基礎,不僅在多項網頁與行動控制的評測領先,提供最低延遲的瀏覽器控制品質、大幅提升 AI 處理線上複雜數位任務的效率。 開發者現已能透過 Gemini API 在 Google AI Studio 及 Vertex AI 上取用此模型。
Google LLC has just announced a new version of its Gemini large language model that can navigate the web through a browser and interact with various websites, meaning it can perform tasks such as ...