Bayangkan sebuah mesin kecerdasan buatan yang mampu memecahkan teka-teki matematika paling rumit di dunia—teka-teki yang bahkan membingungkan para jenius selama beberapa dekade. Itulah janji yang sempat mengguncang komunitas ilmiah, sebelum akhirnya berubah menjadi skandal komunikasi yang memalukan. OpenAI, perusahaan di balik ChatGPT, baru-baru ini menemukan dirinya berada di pusat badai kritik dari para ilmuwan terkemuka.
Kontroversi ini bermula dari sebuah unggahan di platform X oleh Kevin Weil, Wakil Presiden OpenAI. Dalam postingan yang kini telah dihapus itu, Weil dengan bangga mengumumkan bahwa model terbaru mereka, GPT-5, telah "memecahkan 10 soal Erdős dan membuat kemajuan pada 11 soal lainnya." Soal Erdős merujuk pada serangkaian dugaan matematika yang diajukan oleh legenda matematika Paul Erdős—banyak di antaranya tetap tak terpecahkan sejak pertama kali dikemukakan puluhan tahun lalu.
Unggahan tersebut dengan cepat memicu reaksi berantai, tidak hanya dari komunitas matematika tetapi juga dari pesaing langsung OpenAI di industri AI. Apa yang awalnya dirayakan sebagai lompatan besar dalam kemampuan AI untuk penalaran matematika, justru berubah menjadi contoh klasik tentang bagaimana klaim yang dilebih-lebihkan dapat merusak kredibilitas ilmiah. Insiden ini menyoroti tekanan kompetitif yang dihadapi raksasa AI dan pentingnya komunikasi yang akurat dalam era di mana hype sering kali mengalahkan substansi.
Dari Pujian Menjadi Kritik PedasReaksi terhadap klaim OpenAI datang dengan cepat dan tanpa ampun. Demis Hassabis, CEO Google DeepMind, tidak ragu menyebut situasi ini sebagai hal yang "memalukan." Sementara itu, Yann LeCun, Kepala Ilmuwan AI di Meta, menyindir bahwa OpenAI "didorong oleh kegilaan GPT-nya sendiri." Kritik dari dua tokoh terkemuka industri AI ini menunjukkan betapa seriusnya pelanggaran yang dirasakan oleh komunitas ilmiah.
Namun, pukulan paling telak justru datang dari Thomas Bloom, matematikawan yang mengelola situs web yang mengompilasi soal-soal Erdős. Bloom dengan tegas menyatakan bahwa klaim OpenAI bahwa GPT-5 memecahkan soal-soal yang belum terpecahkan adalah "sangat menyesatkan." Ia menjelaskan bahwa kata "terbuka" di situs webnya hanya berarti bahwa ia secara pribadi tidak mengetahui solusinya, bukan berarti soal tersebut belum pernah terpecahkan dalam literatur matematika.
"GPT-5 baru saja menemukan dokumen-dokumen yang tidak saya ketahui," kata Bloom, dengan nada yang jelas-jelas kecewa. Pernyataan ini pada dasarnya mengungkapkan bahwa apa yang dianggap sebagai "pemecahan masalah" sebenarnya hanyalah proses penemuan kembali solusi yang sudah ada—sebuah prestasi yang jauh lebih sederhana daripada menciptakan solusi matematika yang benar-benar baru.
Pengakuan dan Penarikan Kembali yang Canggung
Di bawah tekanan yang semakin meningkat dari komunitas ilmiah, OpenAI akhirnya mengambil langkah mundur. Unggahan asli Kevin Weil dihapus, dan salah satu pendukung klaim awal, Sebastien Bubeck—seorang peneliti di OpenAI—mengakui bahwa GPT-5 tidak menciptakan solusi baru. Sebaliknya, model tersebut "hanya menemukan dokumen yang berisi solusi yang sudah ada sebelumnya."
Namun, pengakuan ini disertai dengan upaya untuk menyelamatkan muka. Bubeck berargumen bahwa hasil tersebut tetap luar biasa karena menemukan dokumen yang berkaitan dengan permasalahan matematika yang kompleks sangatlah sulit. Ia menekankan bahwa kemampuan GPT-5 untuk memindai, mengklasifikasikan, dan mengekstrak makalah akademis yang relevan merupakan pencapaian signifikan, terutama untuk topik-topik dengan dokumen yang tersebar atau terminologi yang kompleks.
Pengakuan yang datang terlambat ini mengingatkan kita pada pentingnya verifikasi yang ketat sebelum membuat klaim publik, terutama dari perusahaan yang memiliki pengaruh sebesar OpenAI. Insiden ini juga menggarisbawahi perlunya protokol etika yang lebih ketat dalam pengembangan AI, sebagaimana telah dikemukakan oleh berbagai pakar di bidangnya.
Baca Juga:
Insiden GPT-5 dan soal Erdős ini bukan sekadar kesalahan komunikasi biasa—ini adalah gejala dari masalah yang lebih besar dalam ekosistem AI kontemporer. Di bawah tekanan persaingan sengit dan tuntutan komersialisasi, perusahaan-perusahaan AI sering kali tergoda untuk melebih-lebihkan kemampuan model mereka. Klaim yang sensasional lebih mudah menyebar dan menarik perhatian media dibandingkan penelitian yang sebenarnya, yang seringkali penuh dengan nuansa dan keterbatasan teknis.
Para ahli telah lama memperingatkan tentang bahaya dari klaim AI yang dilebih-lebihkan. Tidak hanya menyesatkan publik, praktik semacam ini juga dapat merusak kepercayaan terhadap seluruh bidang penelitian AI. Ketika perusahaan membuat klaim yang tidak dapat dipertahankan, mereka tidak hanya merusak reputasi sendiri tetapi juga merugikan seluruh komunitas ilmiah yang bekerja dengan integritas dan kehati-hatian.
Tekanan kompetitif dalam industri AI memang nyata. Dengan persaingan yang semakin ketat antara raksasa teknologi dan pergolakan internal seperti kepergian co-founder OpenAI, godaan untuk membuat klaim yang mengesankan menjadi semakin kuat. Namun, justru dalam lingkungan seperti inilah integritas ilmiah menjadi paling penting.
Masa Depan AI dalam Penelitian MatematikaDi balik kontroversi ini, ada secercah harapan yang disepakati oleh banyak ahli. GPT-5 memang menunjukkan potensi nyata dalam mendukung penelitian matematika, meskipun tidak dalam cara yang semula diklaim oleh OpenAI. Terence Tao, matematikawan terkenal dan penerima Fields Medal, meyakini bahwa AI dapat berperan sebagai "asisten peneliti matematika," membantu mempersingkat waktu pencarian informasi dan menemukan arah baru dalam data akademis yang sangat besar.
Kemampuan AI untuk memproses dan menganalisis volume literatur yang sangat besar—sesuatu yang mustahil dilakukan manusia dalam waktu yang wajar—memang revolusioner. Model seperti GPT-5 dapat membantu peneliti menemukan koneksi antara bidang-bidang matematika yang sebelumnya tampak tidak terkait, atau mengidentifikasi pola yang mungkin terlewatkan oleh mata manusia.
Namun, Tao dengan tegas menekankan bahwa AI tidak dapat menggantikan keahlian manusia. Verifikasi, sintesis, dan pemahaman hakikat masalah masih memerlukan evaluasi dari para peneliti manusia. AI mungkin dapat menemukan jarum di tumpukan jerami, tetapi manusia tetap diperlukan untuk memahami mengapa jarum itu ada di sana dan apa implikasinya terhadap pemahaman kita tentang alam semesta matematika.
Kontroversi GPT-5 dan soal Erdős ini pada akhirnya berfungsi sebagai pelajaran berharga bagi seluruh industri AI. Di era di mana kemampuan AI berkembang dengan kecepatan yang mencengangkan, integritas ilmiah dan komunikasi yang akurat justru menjadi semakin penting. Klaim yang dilebih-lebihkan mungkin menghasilkan headline yang menarik dalam jangka pendek, tetapi hanya kebenaran yang dapat membangun kepercayaan yang berkelanjutan. Sebagaimana yang telah diperdebatkan dalam berbagai konteks, termasuk diskusi sains yang kompleks lainnya, transparansi dan kejujuran intelektual tetap menjadi fondasi kemajuan ilmiah yang sesungguhnya. Masa depan AI dalam matematika tetap cerah—asalkan kita belajar dari kesalahan komunikasi ini dan melanjutkan perjalanan dengan kehati-hatian dan kerendahan hati intelektual yang diperlukan.