Daftar Isi
Google Luncurkan AI Gemini 2.5
Google baru saja mengumumkan keluarga model AI terbaru mereka, Gemini 2.5, yang memiliki kemampuan untuk "berpikir" sebelum menjawab pertanyaan. Model pertama yang diluncurkan adalah Gemini 2.5 Pro Experimental, yang diklaim sebagai model AI paling cerdas dari Google hingga saat ini. Model ini bisa diakses melalui platform pengembang Google AI Studio dan aplikasi Gemini untuk pelanggan paket Gemini Advanced seharga $20 per bulan.
AI yang Bisa Berpikir
Gemini 2.5 Pro Experimental adalah model AI multimodal yang menggunakan teknik penalaran untuk memeriksa fakta dan memecahkan masalah sebelum memberikan jawaban. Google menyatakan bahwa semua model AI baru mereka ke depannya akan dilengkapi dengan kemampuan penalaran ini. Sejak OpenAI meluncurkan model AI penalaran pertama mereka, o1, pada September 2024, banyak perusahaan teknologi lainnya seperti Anthropic, DeepSeek, Google, dan xAI berlomba untuk mengembangkan model yang setara atau lebih baik.
Kinerja Gemini 2.5 Pro
Google mengklaim bahwa Gemini 2.5 Pro mengungguli model AI sebelumnya dan beberapa model AI teratas dari kompetitor dalam berbagai benchmark. Model ini dirancang khusus untuk menciptakan aplikasi web yang menarik secara visual dan aplikasi coding yang berorientasi pada agen. Pada evaluasi Aider Polyglot yang mengukur pengeditan kode, Gemini 2.5 Pro mencapai skor 68.6%, mengalahkan model AI teratas dari OpenAI, Anthropic, dan DeepSeek. Namun, pada tes SWE-bench Verified yang mengukur kemampuan pengembangan perangkat lunak, Gemini 2.5 Pro mencapai skor 63.8%, mengalahkan o3-mini dari OpenAI dan R1 dari DeepSeek, tetapi kalah dari Claude 3.7 Sonnet dari Anthropic yang mencapai skor 70.3%.
Uji Multimodal Humanity's Last Exam
Pada tes multimodal Humanity's Last Exam yang terdiri dari ribuan pertanyaan crowdsourced terkait matematika, humaniora, dan ilmu alam, Gemini 2.5 Pro mencapai skor 18.8%, yang lebih baik dibandingkan sebagian besar model andalan pesaingnya. Ini menunjukkan bahwa model ini memiliki kemampuan yang luas dalam berbagai bidang pengetahuan.
Kapasitas Token yang Luar Biasa
Gemini 2.5 Pro diluncurkan dengan jendela konteks 1 juta token, yang berarti model AI ini dapat memproses sekitar 750.000 kata sekaligus. Ini lebih panjang dari seluruh seri buku "Lord of The Rings". Google juga berencana untuk meningkatkan panjang input menjadi 2 juta token dalam waktu dekat. Namun, Google belum mempublikasikan harga API untuk Gemini 2.5 Pro dan akan memberikan informasi lebih lanjut dalam beberapa minggu mendatang.
Dampak dan Biaya Model AI Penalaran
Model AI penalaran seperti Gemini 2.5 Pro telah membantu mencapai ketinggian baru dalam tugas matematika dan coding. Banyak orang di dunia teknologi percaya bahwa model penalaran akan menjadi komponen kunci dari agen AI, sistem otonom yang dapat melakukan tugas tanpa banyak intervensi manusia. Namun, model-model ini juga lebih mahal untuk dioperasikan.
Eksperimen Sebelumnya dengan AI Penalaran
Google sebelumnya telah bereksperimen dengan model AI penalaran, termasuk versi "berpikir" dari Gemini yang dirilis pada Desember. Namun, Gemini 2.5 mewakili upaya paling serius Google untuk mengalahkan seri model "o" dari OpenAI.
Secara kesel
powered by jamterbang.com