Bos OpenAI Butuh Bantuan untuk Latih ChatGPT Bahasa Indonesia

redaksiharian.com – ChatGPT menjadi chatbot berbasis kecerdasan buatan (artificial intelligence/AI) yang populer digunakan, termasuk di Indonesia.

ChatGPT pada dasarnya dirancang untuk memahami dan menghasilkan teks dalam bahasa Inggris.

Chatbot bikinan OpenAI ini sebenarnya juga mampu memahami perintah dan menghasilkan teks dalam berbagai bahasa, termasuk Indonesia. Namun, dalam beberapa kasus, ChatGPT belum optimal memahami perintah dalam bahasa Indonesia .

ChatGPT CEO OpenAI Sam Altman pun mengungkapkan keinginannya untuk meningkat dukungan ChatGPT untuk bahasa Indonesia.

“Kami sangat ingin sekali meningkatkan dukungan ChatGPT untuk Bahasa Indonesia . Namun, kami butuh bantuan,” kata Sam saat berbicara di panggung acara “Conversation with Sam Altman” di Jakarta Pusat, Rabu (14/6/2023).

Sam mengharapkan Indonesia bisa membuat dataset dalam Bahasa Indonesia untuk melatih dan mengevaluasi model bahasa generasi selanjutnya.

“Saya pikir jika Indonesia dapat menyediakan kumpulan data (dataset) dan mengevaluasi bahasa, kami akan dengan senang hati menggunakannya dan memasukkannya ke dalam model GPT kami berikutnya,” kata Sam.

Sayangnya, menurut Sam, dataset itu sulit untuk tersedia dan digunakan perusahaannya. Makanya, harus ada kolaborasi untuk melatih ChatGPT untuk semakin baik, khususnya dalam Bahasa Indonesia.

“Bila melatih model bahasa dengan dataset Indonesia ini juga akan sangat bagus untuk masyarakat Indonesia. Dan kami akan sangat senang untuk berkolaborasi,” kata pria bernama lengkap Samuel Harris Altman ini.

Lihat Foto

Ilustrasi chatbot ChatGPT

Saat ini, OpenAI sudah mengembangkan tiga model bahasa (language model). Salah satunya GPT-3.5 yang digunakan pada chatbot AI ChatGPT.

Secara umum, GPT-3.5 yang digunakan di ChatGPT baik memahami bahasa Inggris dan beberapa bahasa yang paling banyak digunakan di dunia.

Saat ini, salah satu cara untuk meningkatkan dukungan bahasa Indonesia di ChatGPT adalah pengguna sebisa mungkin memberikan feedback alias umpan balik terhadap jawaban ChatGPT.

Untuk diketahui, ChatGPT menggunakan metode Reinforcement Learning from Human Feedback (RLHF), atau model pembelajaran machine learning yang memungkinkan software untuk mempelajari lingkungannya sesuai dengan feedback yang diberikan pengguna.

Namun, tantangan selama proses Reinforcement Learning (RL) saat ini adalah tidak adanya sumber kebenaran. Nah, menurut Sam, bila Indonesia menyediakan dataset, ini akan membantu proses pelatihan dan evaluasi pada model bahasa GPT.

OpenAI juga memiliki model bahasa GPT-3 dan GPT-4. Sam menjelaskan, model bahasa GPT-3 sangat baik memahami bahasa Inggris, namun, tak terlalu baik dalam bahasa lain.

Sementara GPT-4, kata Sam, sangat baik memahami input dari bahasa Inggris dan top 20 bahasa lain yang populer di dunia.

Bos OpenAI itu mengungkapkan bahwa pihaknya mau mengembangkan GPT-5 menjadi model bahasa yang sangat baik, bahkan dalam bahasa dan dialek yang tak banyak digunakan oleh orang.