Sarvam AI India Guncang Dunia AI, Kalahkan Gemini dan ChatGPT di Uji OCR

mediaindonesia.com
5 jam lalu
Cover Berita

SELAMA ini, pusat pengembangan kecerdasan buatan dunia seolah hanya menjadi milik Amerika Serikat dan Tiongkok. India, meski memiliki sumber daya manusia yang melimpah, sering kali dipandang sebelah mata dalam urusan pengembangan model AI inti. 

Namun, persepsi global tersebut kini mulai bergeser berkat terobosan Sarvam AI. Startup yang berbasis di Bengaluru ini sukses memperkenalkan konsep "AI Berdaulat" melalui dua inovasi unggulannya, Sarvam Vision dan Bulbul, yang secara mengejutkan mampu mengungguli raksasa teknologi dunia.

Sarvam Vision menjadi perbincangan hangat setelah menunjukkan performa luar biasa dalam pengenalan karakter optik atau OCR. Hebatnya, model ini mampu melampaui skor akurasi model-model besar seperti Google Gemini 3 Pro dan DeepSeek OCR v2 dalam pengujian olmOCR-Bench dengan raihan skor 84,3%. 

Baca juga : Warga India Ramai Gunakan Chatbot untuk Bicara dengan Tuhan dan Cari Bimbingan Spiritual

Prestasi ini menempatkan Sarvam jauh di atas ChatGPT dalam hal kemampuan membaca dan memahami dokumen. Ketangguhan Sarvam Vision semakin terbukti pada pengujian OmniDocBench, di mana ia mampu memproses tata letak dokumen yang rumit, tabel teknis, hingga rumus matematika yang biasanya sangat sulit dibaca sistem OCR konvensional.

Keberhasilan ini lantas mengubah keraguan para ahli menjadi pujian. Salah satunya datang dari komentator teknologi Deedy Das yang sebelumnya sempat skeptis terhadap fokus Sarvam dalam membangun model bahasa lokal yang lebih kecil. 

Melalui unggahannya di media sosial X, ia mengakui kesalahannya dan memuji Sarvam karena berhasil mengisi celah yang selama ini diabaikan laboratorium AI global. Baginya, kemampuan Sarvam dalam mengolah teks dan suara untuk bahasa-bahasa di India adalah sesuatu yang sangat berharga dengan harga yang sangat terjangkau bagi pasar lokal.

Baca juga : Meta dan YouTube Diseret ke Pengadilan Terkait Kesehatan Mental Anak

Tidak berhenti di situ, Sarvam juga menggebrak lewat peluncuran Bulbul V3, sebuah model suara bertenaga AI yang dirancang untuk menghasilkan ucapan yang sangat alami dan ekspresif. 

Model text-to-speech ini dikembangkan khusus untuk menangani berbagai karakteristik unik bahasa India agar tetap stabil dan akurat saat digunakan dalam kebutuhan industri. Saat ini, Bulbul sudah mendukung 35 jenis suara dalam 11 bahasa daerah dan berencana untuk terus berekspansi hingga mencakup 22 bahasa nasional India.

Penerimaan positif juga dirasakan para pelaku industri, seperti Pratik Desai dari KissanAI, yang kini menjadikan Bulbul sebagai pilihan utama untuk kebutuhan layanan berbasis suara di India. Ia menilai kualitas Bulbul terus meningkat di setiap versinya, sementara biaya layanan serupa dari penyedia global seperti ElevenLabs dianggap tidak lagi masuk akal bagi pasar regional. 

Dengan pencapaian ini, Sarvam AI tidak hanya membuktikan kekuatannya secara teknis, tetapi juga menunjukkan pemahaman mendalam terhadap kebutuhan lokal bisa menjadi senjata ampuh untuk mengalahkan dominasi perusahaan teknologi raksasa. (Indian Today/Z-2)


Artikel Asli

Berikan komentar Anda
Lanjut baca:

thumb
PSSI Terima Sanksi dari AFC Usai Piala Asia Futsal, Tak Ajukan Banding
• 36 menit lalukumparan.com
thumb
No Forest, No Future! Konsolidasi Pemimpin Lintas Iman di Workshop IRI Indonesia
• 2 jam lalurepublika.co.id
thumb
Eks Striker Persebaya Dejan Tumbas Bertekad Bawa Persis Keluar Zona Degradasi
• 4 jam lalugenpi.co
thumb
Pramono Minta 3 Siswa yang Siram Air Keras Ditindak Tegas: Tak Ada Kompromi!
• 4 jam lalukumparan.com
thumb
Jaminan Al Nassr ke Ronaldo agar CR7 Tak Mogok Main Lagi: Mengembalikan Wewenang
• 3 jam lalutvonenews.com
Berhasil disimpan.