CALIFORNIA, HAWA – Peneliti dari Apple Inc. resmi merilis makalah penelitian tentang Ferret-UI Lite pada Jumat (20/02). Model kecerdasan buatan ringan ini dirancang khusus untuk memahami dan berinteraksi dengan antarmuka aplikasi secara langsung di perangkat seluler, web, dan desktop.

Apple mengembangkan model ini untuk mengatasi kelemahan AI sebelumnya yang sangat bergantung pada pemrosesan komputasi awan. Oleh karena itu, perusahaan memfokuskan Ferret-UI Lite pada efisiensi perangkat lokal agar data sensitif pengguna seperti pesan, aplikasi keuangan, dan data kesehatan tidak pernah meninggalkan perangkat. Model ini hanya memiliki 3 miliar parameter atau 24 kali lebih kecil dibandingkan model kompetitor sejenisnya.

Selain itu, sistem ini bekerja menggunakan mekanisme dua tahap untuk mengenali antarmuka pengguna. Sistem memindai layar penuh terlebih dahulu, lalu memotong dan memperbesar area yang relevan untuk memastikan tingkat presisi tinggi pada elemen kecil seperti ikon dan teks. Tim peneliti juga melatih model ini menggunakan simulasi interaksi aplikasi nyata dan sintetis guna menangani kesalahan seperti ketukan layar yang tidak responsif.

Berdasarkan hasil uji coba yang terbit di platform akademik arXiv, sistem baru ini mencetak akurasi 91,6 persen pada ScreenSpot-V2 dan 53,3 persen pada ScreenSpot-Pro. Angka ini berhasil mengungguli pesaingnya, TARS1 7B, dengan selisih lebih dari 15 poin persentase. Sementara itu, tingkat keberhasilan navigasi mencapai 28 persen pada AndroidWorld dan 19,8 persen pada OSWorld.

“Tim berfokus pada perampingan model, bukan memperbesar ukurannya, sekaligus membagikan pelajaran penting untuk membangun agen AI on-device yang efisien, tangguh, dan praktis,” kata Zhe Gan, Peneliti Apple.

Selanjutnya, kehadiran Ferret-UI Lite memiliki kaitan erat dengan rencana perombakan besar-besaran asisten virtual Siri. Apple menargetkan peluncuran kemampuan baru ini pada sistem operasi iOS 26.4 sekitar musim semi tahun 2026 mendatang. Integrasi ini akan memungkinkan Siri membaca konten langsung dari layar pengguna dan mengeksekusi perintah multi-langkah secara mandiri.I*/LIA