Di area produksi pabrik garmen di Suqian, Provinsi Jiangsu, China, Cheng Weiqing (50) duduk di depan mesin jahit. Sudah lebih dari sepuluh tahun ia mengerjakan proses yang membutuhkan keterampilan tangan dan kaki, mulai dari menekan pedal, menyelaraskan kain, mengatur kecepatan, hingga merapikan tepi jahitan. Rutinitas itu nyaris tak berubah.
Namun, belakangan ada satu hal baru yang terlihat pada diri Weiqing, yakni sebuah perangkat elektronik terpasang di dahinya. Perangkat bernama JoyEgoCam itu menyerupai headband plastik hitam dengan kamera kecil di kedua ujungnya. Kamera itu merekam pandangan, ritme kerja, dan gerakan tangan Cheng.
JoyEgoCam mulai dikenakan Cheng dan sejumlah pekerja lain di pabrik garmen sejak April 2026. Saat itu, teknisi dari raksasa ritel China, JD.com, datang ke pabrik dan menjelaskan rencana pengumpulan data dengan kamera kepala. Pekerja yang bersedia akan mendapat insentif harian. Cheng menjadi orang pertama yang mendaftar.
Ketika ditanya apakah takut digantikan robot, Cheng tersenyum sembari mesin jahitnya tetap berjalan.
”Kalau robot bisa belajar menjahit, itu akan baik untuk industri kami. Generasi saya bekerja sebagai buruh garmen sepanjang hidup. Berat. Anak muda mana yang mau kerja semacam ini?” ujarnya saat ditemui Yibang AI, media industri teknologi dari China, pada Mei 2026.
Tidak jauh dari pabrik itu, di sebuah rumah sakit lansia di Suqian, seorang perawat juga mengenakan JoyEgoCam. Ia memijat seorang nenek, memakaikan sepatu dan jaket, lalu membantu mengangkatnya ke kursi roda. Cara menopang tubuh lansia, membantu makan, dan memindahkan pasien juga direkam.
”Kami sangat berharap robot bisa membantu mengerjakan pekerjaan berat seperti ini,” kata perawat itu.
Perekaman pekerjaan melalui JoyEgoCam bertujuan menyediakan data pelatihan bagi robot. Sebagaimana model bahasa besar (large language model/LLM) yang memerlukan triliunan kata, robot yang mampu mengerjakan pekerjaan fisik manusia juga butuh datanya sendiri.
Dalam industri robotika, rekaman semacam itu dikenal sebagai egocentric video, yakni video dari sudut pandang orang pertama yang memperlihatkan bagaimana tangan manusia meraih, memegang, memindahkan benda, dan berinteraksi dengan lingkungan sekitar.
”Saat ini, pengumpulan data dari internet bisa dibilang mayoritas sudah selesai dilakukan. Sekarang, perusahaan teknologi AI berlomba mencari data berikutnya, yaitu ’real world data’,” kata Alfons Tanujaya.
Jenis data ini menjadi bagian dari apa yang disebut humanoid data atau kumpulan data gerakan, penglihatan, dan interaksi manusia yang dipakai untuk melatih robot agar dapat bekerja di lingkungan manusia.
Menurut pakar siber Alfons Tanujaya, perkembangan ini tidak bisa dihindari.
”Saat ini, pengumpulan data dari internet bisa dibilang mayoritas sudah selesai dilakukan. Sekarang, perusahaan teknologi AI berlomba mencari data berikutnya, yaitu real world data,” kata Alfons kepada Kompas, Selasa (9/6/2026), di Jakarta.
Setelah ChatGPT, Claude, hingga Gemini membuktikan bahwa data teks dalam jumlah masif dapat menghasilkan lompatan kemampuan AI, industri robotika mencoba menerapkan logika serupa. Persoalannya, tidak ada perbendaharaan ”gerakan manusia” untuk bahan pelatihan.
Fei-Fei Li, pakar komputer yang memimpin Stanford Institute for Human-Centered Artificial Intelligence, menyebut LLM saat ini sebagai wordsmith in the dark atau perangkai kata yang fasih, tetapi tanpa benar-benar memahami wujud fisik suatu konsep.
Model bahasa besar memang dapat menjelaskan cara menjahit atau merawat pasien lansia. Namun, mampu menjelaskan suatu konsep saja tidak berarti memiliki kemampuan untuk melakukan hal tersebut.
Kemampuan memahami ruang fisik itu, menurut Li, disebut spatial intelligence atau kecerdasan spasial.
”Setelah bahasa, frontier selanjutnya bagi AI adalah ruang fisik,” kata Li, yang juga anggota Dewan Penasihat Ilmiah PBB, dalam esainya di Substack pada November 2025.
Kecerdasan spasial mencakup kemampuan memahami hubungan antarbenda, jarak, arah, bentuk, gerak, dan akibat dari suatu tindakan. Li menyebut AI world model atau model dunia sebagai upaya memberi kemampuan itu kepada sistem AI agar dapat bernalar dan berinteraksi di lingkungan nyata.
”Untuk pertama kalinya dalam sejarah, kita berada pada titik ketika mesin berpotensi memahami dunia fisik dengan cukup baik sehingga dapat menjadi mitra manusia dalam menghadapi berbagai tantangan,” tulis Li.
Sebelum itu terwujud, industri AI harus mengumpulkan data dunia nyata dalam jumlah sangat besar.
Fenomena ini berlangsung dalam skala besar, terutama di China. JD.com, seperti dikutip Rest of World, menargetkan pengumpulan 10 juta jam data pelatihan robot dalam dua tahun. Untuk mencapainya, perusahaan itu berencana melibatkan hingga 100.000 karyawan dan 500.000 pekerja eksternal yang merekam aktivitas sehari-hari.
Pemerintah daerah di China ikut membangun pusat pengumpulan data robot. Hingga akhir 2025, lebih dari 40 pusat semacam itu telah diumumkan untuk menghasilkan data yang dapat digunakan bersama oleh industri robotika.
Di Amerika Serikat, pengumpulan data robot lebih banyak dilakukan melalui start up dan platform kerja lepas.
Dalam eksperimen yang diceritakan di Wired, jurnalis Reece Rogers memasang iPhone di dahinya selama sepekan untuk merekam pekerjaan rumah tangga sebagai data pelatihan robot, seperti mengiris timun, mencuci piring, melipat pakaian, mengikat tali sepatu, menuang minuman, hingga membuang sampah.
”Saya mengiris timun sambil membungkuk agar iPhone yang terikat di dahi dapat merekam kedua tangan saya,” tulis Rogers.
Pada era media sosial, pengguna tanpa sadar menghasilkan data untuk melatih algoritma digital. Pada era robotika, pekerja secara sadar merekam gerakan tubuh untuk melatih kecerdasan di dunia fisik.
MIT Technology Review melaporkan adanya sebuah start up bernama Micro1 yang telah merekrut ribuan pekerja kontrak di lebih dari 50 negara untuk menghasilkan video serupa.
Start up lain, Kled, memungkinkan siapa saja menjual rekaman aktivitas sehari-hari sebagai data pelatihan robot.
”Saya ingin setiap orang di planet ini merekam dirinya mencuci piring,” ujar pendiri Kled, Avi Patel, dikutip Wired.
Meski demikian, tidak semua peneliti yakin strategi mengumpulkan video rekaman aktivitas manusia akan otomatis menghasilkan robot yang mampu bekerja seperti manusia.
Ken Goldberg, peneliti robotika dari University of California, Berkeley, menilai upaya itu menjanjikan, tetapi lambat.
”Ini adalah upaya yang mulia, tetapi ingat, prosesnya akan lambat. Bahkan, jika Anda memiliki ratusan orang yang bekerja, akan membutuhkan waktu lama untuk mengumpulkan data yang cukup,” ujarnya kepada Rest of World.
Di tengah perlombaan itu, Indonesia berpotensi menjadi pasar penyedia data manusia untuk industri AI global. Biaya tenaga kerja yang relatif rendah, penetrasi internet yang luas, serta banyaknya pekerja lepas digital dapat membuat masyarakat mudah tertarik pada tawaran merekam wajah, suara, percakapan, atau aktivitas sehari-hari dengan imbalan tertentu.
Chairman Lembaga Riset Keamanan Siber CISSReC Pratama Persadha menilai fenomena orang menjual data pribadi kepada platform pengumpul data AI sebagai perkembangan penting dalam ekonomi digital. Individu kini secara sadar menjual identitas digitalnya sebagai komoditas untuk melatih sistem AI.
”Jika pada masa lalu yang diperjualbelikan adalah tenaga kerja, maka pada era AI, yang mulai diperjualbelikan adalah representasi digital manusia itu sendiri,” kata Pratama.
Jika wajah atau suara seseorang telah dipelajari model AI secara mendalam, identitas itu akan melekat sepanjang hidup.
Perilaku ini mengundang risiko yang tidak kecil. Data seperti wajah, suara, pola gerak tubuh, intonasi bicara, dan ekspresi merupakan identitas biometrik yang tidak dapat diganti seperti kata sandi.
Jika wajah atau suara seseorang telah dipelajari model AI secara mendalam, identitas itu akan melekat sepanjang hidup.
Pratama mengingatkan, data semacam itu dapat membuka risiko deepfake, penipuan berbasis suara sintetis, hingga hilangnya kontrol individu atas data pribadi.
Banyak platform juga meminta lisensi panjang, bahkan permanen, sehingga data yang diberikan hari ini dapat terus digunakan tanpa kompensasi tambahan.
Karena itu, fenomena ini tidak cukup dilihat sebagai peluang pendapatan baru. Pemerintah perlu memastikan adanya aturan jelas mengenai persetujuan, penggunaan ulang, penghapusan, dan pembagian manfaat ekonomi dari data tersebut.
”Dalam konteks keamanan siber nasional, fenomena ini perlu dipandang bukan sekadar sebagai aktivitas ekonomi digital, melainkan sebagai persoalan perlindungan identitas dan kedaulatan data,” kata Pratama.
Pada akhirnya, perlombaan membangun robot pintar ikut mengubah posisi manusia dalam ekonomi AI. Manusia tidak lagi hanya menjadi pengguna teknologi. Pengalaman, gerakan, suara, wajah, dan kebiasaan manusia mulai menjadi bahan baku untuk membentuk kemampuan mesin.
Saat Cheng menjahit pakaian di Suqian, ketika seorang perawat mengangkat pasien lansia, atau ketika Rogers memasak di apartemennya, mereka semua sedang menghasilkan bahan pelatihan untuk robot tentang cara manusia memahami dunia fisik.
Gerakan tangan, ritme kerja, cara memegang benda, hingga keputusan kecil yang selama ini dilakukan secara naluriah ini perlahan diterjemahkan menjadi data.
Di sini batas antara manusia dan AI mulai terasa kabur. Jika pada era LLM, internet menjadi cerminan pikiran manusia yang dipakai untuk melatih AI, maka pada era robotika, tubuh manusia mulai menjadi sumber pembelajaran berikutnya.
Tanpa kewaspadaan dan perlindungan yang memadai, manusia berisiko diperlakukan sebagai komoditas semata.





