URnews

Mempersoalkan Kepemilikan Data Pengembangan Artificial Intelligence

Firman Kurniawan S, Senin, 26 Agustus 2024 10.48 | Waktu baca 6 menit
WhatsApp ShareFacebook ShareTwitter ShareLinkedin Share
Mempersoalkan Kepemilikan Data Pengembangan Artificial Intelligence
Image: Ilustrasi Pexels

Jakarta - Ketika data diolah jadi informasi, dan informasi merupakan bahan penyusun pengetahuan, jadi milik siapakah sintesa pengetahuannya? Dan terhadap sintesa pengetahuan itu, sejauh mana pemiliknya masih dapat memperoleh manfaat?

Kedua pertanyaan ini kerap diajukan, seiring realitas: data punya nilai setinggi bahan tambang. Data is the new oil. Alangkah ruginya pemilik data, jika haknya tak diakui manakala keuntungan diperoleh.

Hanya perusahan-perusahaan pemilik teknologi pengolahnya yang jadi penikmat. Demikian berharganya data, tak jarang jadi pembicaraan yang kompleks. Pembahasannya tak berkesudahan.

Salah satu kasus yang sedang mengemuka: ketaksepakatan penggunaan dan kepemilikan data, antara Platform X yang dimiliki Elon Musk dengan Masyarakat Uni Eropa (UE).

Persengketaan itu terjadi, baru dalam hitungan pekan lalu. Seluruhnya dikisahkan dalam artikel “X Agrees to Halt Use of Certain EU Data for AI Chatbot Training”. Ini ditulis Muhammad Zulhusni, 2024.

Disebutkannya pengadilan Irlandia pada 8 Agustus 2024 lalu, menyatakan Platform X telah sepakat untuk menunda penggunaan semua data milik Masyarakat UE.

Kesepakatan ini artinya, X dilarang menggunakan data yang bersumber dari interaksi Masyarakat UE di platform yang semula bernama Twitter itu. Data yang dimaksud, berupa semua jejak digital jutaan interaksi para pengguna X. 

Ini rencananya digunakan sebagai material pelatihan Chatbot Grok. Chatbot percakapan berbasis AI yang dikembangkan xAI, juga perusahaan yang dimiliki Elon Musk.

Grok berupa AI generatif, dikembangkan berdasarkan large language model (LLM). Namun keistimewaannya dibanding chatbot lain, Grok mampu berinteraksi seraya menunjukkan selera humor. Dalam pernyataan promosinya disebutkan, Grok akan jadi perangkat yang bersifat opensource. 

Penggunanya dapat melakukan pemanfaatan bersama dengan X. 

Sedangkan xAI, adalah perusahaan yang didirikan Elon Musk Sejak Maret 2023. Perusahaan rintisan ini, didirikan guna mewadahi visi-visi pengembangan AI Sang Pemilik.

Ini utamanya setelah Musk tak sejalan lagi dengan Sam Altman, CEO OpenAI, yang perusahaannya didirikan bersama Musk.

Kembali pada inisiatif penundaan penggunaan data di atas. Kesediaan X didorong oleh keberatan Data Protection Commision (DPC) Irlandia. Yang seluruhnya diajukan seiring pengawasan ketat pengembangan AI di seluruh UE.

Pengembangan AI sedang marak, dilakukan oleh perusahaan-perusahan besar di bidang teknologi. Ini berimbas pada munculnya situasi konflik, juga ketegangan yang dialami hampir semua negara UE. Ketidakjelasan posisi antara kemajuan AI dengan kesiapan perlindungan datanya, jadi pemicu utama.

Karenanya, badan pengawas memerintahkan penahanan dan penangguhan aktivitas penggunaan data Masyarakat UE, yang bakal digunakan X untuk pengembangan, pelatihan, dan penyempurnaan sistem AI.

Tentu saja soal penangguhan itu bukan perkara sederhana. Sebab diduga bakal mempengaruhi reputasi X. Juga kelancaran dalam mewujudkan rencananya.

Walaupun X telah sepakat menunda, namun masih ada upaya para ahli hukumnya mengajukan nota keberatan. Ini terepresentasi lewat pernyataan yang menyebut, perintah penghentian penggunaan data Masyarakat UE, dianggap tak beralasan.

Seluruhnya dapat merusak upaya menjaga platform tetap aman dari pembatasan penggunaan teknologi AI di UE. Substansi persengketaannya menyoroti: keseimbangan yang tak mudah dirumuskan antara kepatuhan pada aturan dengan kelangsungan operasional yang telah disusun perusahaan teknologi itu, dalam situasi digital hari ini.

Namun tindakan penangguhan terhadap X, bukan kejadian satu-satunya. Perusahaan-perusahaan teknologi besar lainnya, menghadapi tantangan serupa. Seperti, Meta menunda peluncuran model Meta AI di Eropa.

Juga Google yang melakukan penundaan maupun penyempurnaan chatbot Gemini AI. Ini setelah keduanya berkonsultasi dengan DPC Irlandia.

Hari ini bukan merupakan pengetahuan baru, jika disebut data berperan sentral dalam pengembangan AI.

Relasi data dengan machine learning (ML) dapat difomulasikan sebagai: makin besar volume, velocity, value, variety, dan veracity data, algoritma yang dihasilkannya lebih memuat keterhubungan yang beragam.

Juga pola yang lebih konsisten, mampu merepresentasikan realitas dunia. Dunia yang kecerdasannya diserap perangkat. Ketika pada ML dilatih mengenali Beruang, dengan menunjukkan gambar 10 variasi Beruang.

Maka hasil pembelajaran mesin, akan lebih menemukan akurasi Beruang, saat datanya dinaikkan menjadi 100 Beruang, dengan 100 variasi. Terlebih jika kecepatan (velocity), nilai (value) dan kebenarannya (veracity), juga dilipatgandakan.

Data yang dikaitkan dengan penyusunan AI, terbagi dalam 3 penggunaan. Ini masing-masing pertama, data pelatihan. Data jenis ini digunakan untuk melatih model AI.

Ini misalnya saat AI diperkenalkan pada makhluk yang diklasifikasi sebagai Beruang. Kepadanya diberikan umpan data yang memenuhi kriteria 5V di atas.

AI berlatih mengenali seluruh ciri dalam kategori Beruang. Jika prosesnya telah selesai, sensor perangkat, mampu memastikan: yang hadir di hadapannya adalah Beruang.

Sedangkan yang kedua, data uji. Ini digunakan untuk menguji model yang dikembangkan, dan membandingkannya dengan model lain. Lewat data uji ini, AI mampu membedakan Beruang, dan bukan menyebut mahluk besar berbulu lainnya. Kemampuan ini jadi petunjuk kelulusan dalam ujiannya. AI tak menyebut Gorila, alih-alih Singa dengan surai lebatnya.

Dan ketiga, data validasi. Wujudnya berupa data yang digunakan untuk memvalidasi model AI akhir. Setelah melalui uji berulang ulang, AI dengan cepat mampu mengenali Beruang di antara kumpulan data mahluk maupun benda-benda lainnya.

Lewat tiga proses dan data yang berbeda itu, saat dilekatkan pada mesin pemburu Beruang berbasis AI, kinerjanya tervalidasi. Karenanya dapat diandalkan untuk mengendalikan kelebihan populasi Beruang, tanpa salah menyortir Gorila maupun Singa di habitat alamiahnya.

Seluruh pengelompokan data di atas, mengacu pada pernyataan Potter Clarkson. Sebuah perusahaan yang bergerak di bidang hukum, yang melindungi kekayaan intelektual.

Lingkup kerjanya berupa layanan lengkap berbasis keahlian di bidang paten, merek dagang, desain, mewakili proses pengadilan, perizinan maupun konsultasi. Layanan yang tampaknya juga diberikan dalam persengketaan yang terkait pemanfaatan data dalam pengembangan AI.

Besarnya nilai data, sangat dipengaruhi pemahaman pemilik datanya. Lalu bagaimana pemahaman Masyarakat Indonesia terhadap hal ini? Ini mengingat Masyarakat Indonesia merupakan pengguna intensif berbagai platform maupun aplikasi yang massif menghasilkan data.

Mampukah masyarakat Indonesia bertindak semestinya terhadap penggunaan datanya, oleh aneka perusahaan teknologi global? Yang kemudian diwujudkan negara, dengan melahirkan undang-undang perlindungan data masyarakat dari penggunaan nonkonsensual?

Seluruhnya dapat berkaca pada Masyarakat UE dengan GDPR-nya General Data Protection Regulation yang melindungi ketat penggunaan data Masyarakat EU, oleh individu maupun lembaga di luar UE.

Terhadap upaya perlindungan semacam uraian di atas, Potter Clarkson mengemukakan, dimungkinkannya pengajuan tuntutan secara hukum terhadap penggunaan data nonkonsensual.

Contoh kasusnya, tuntuan yang diajukan kepada Stability AI oleh Getty Images di Inggris dan Amerika. Tuntutan itu diajukan, saat data Getty Image digunakan untuk pelatihan ML dalam pengembangan Stable Diffusion. 

Seluruhnya adalah pelanggaran hak cipta. Stable Diffusion merupakan AI generatif, yang dikembangkan Stability AI. Tuntutan Getty Image juga mencakup pengetahuan yang dihasilkan dari pelatihan yang memanfaatkan datanya. Ini disimpan sebagai gambar laten.

Dalam argumentasi Getty Image: tanpa gambar-gambar yang bersumber darinya, Stable Diffusian alih-alih menghasilkan gambar laten melakukan pelatihan ML pun tak punya datanya.

Persengketaan Getty Image vs Stability AI nampaknya belum menemui titik terangnya. Ini diduga ada anggapan: yang dilakukan Stability AI tak beda dari yang dilakukan perusahaan pengembang AI lainnya. Bing oleh Microsoft, Gemini oleh Google, ChatGPT oleh OpenAI, juga Grok oleh xAI.

Namun dengan tuntutan Getty Image publik dapat dipahamkan, data yang digunakan tanpa kejelasan status konsensualnya dapat melahirkan tuntutan hukum. Juga mencemari hasil akhir yang diperoleh.

Jikapun pemahaman soal data belum terlalu berkembang di Indonesia, lewat proses pengembangan AI, pemahaman terbit. Terhadap ketidakjelasan 3 jenis data yang digunakan, juga sumber datanya, maka penggunaan generatif AI untuk menghasilkan karya, termasuk karya di lingkungan akademis, dapat tercemar hasil akhirnya.

Karenanya mutlak memahami jenis dan sumber data, juga status konsensualnya. Jadi seandainya hasil itu adalah artikel ilmiah, disertasi doktor, karya seni kreatif, berisiko berhadapan dengan pertanyaan: milik siapakah hasil akhir itu?

Ini jika dirunut dari data yang digunakannya. Dalam hal tak jelas status datanya, lebih baik menghindari penggunaannya. Daripada menghadapi tuntutan hukum, atau menanggung karya yang tercemar.

Baca Juga: Realitas Cair Zaman Artificial Intelligence

*Penulis adalah Pemerhati Budaya dan Komunikasi Digital serta pendiri LITEROS.org

* Tulisan ini merupakan tanggung jawab penulis, bukan pandangan Urbanasia

Komentar
paper plane

Berita Terkait
    Berita Terkait