Meta Luncurkan API Llama, Percepat Pengembangan Aplikasi AI
Meta, perusahaan induk dari Facebook, WhatsApp, dan Instagram, secara resmi meluncurkan Application Programming Interface (API) untuk model bahasa besar (LLM) Llama. Pengumuman ini disampaikan pada konferensi pengembang AI perdana Meta, LlamaCon, yang berlangsung pada hari Selasa, 29 April 2025 di Amerika Serikat.
API Llama dihadirkan sebagai solusi bagi pengembang aplikasi yang ingin mengintegrasikan kemampuan AI ke dalam aplikasi mereka dengan lebih mudah. Chief Product Officer (CPO) Meta, Chris Cox, menyatakan bahwa penggunaan Llama kini dapat dilakukan hanya dengan satu baris kode, menyederhanakan proses implementasi secara signifikan.
Kolaborasi antara Meta dan Cerebras System menjadi kunci dalam menghadirkan API Llama dengan performa tinggi. Cerebras System berperan menyediakan chip AI yang dioptimalkan untuk meningkatkan kemampuan model Llama. Hasilnya, API Llama menawarkan kecepatan inferensi (proses pembelajaran, pengambilan keputusan, prediksi, atau kesimpulan data oleh model AI) hingga 18 kali lebih cepat dibandingkan dengan solusi berbasis GPU tradisional.
Keunggulan sistem Cerebras juga memungkinkan Llama 4 (versi terbaru dari Llama) untuk memproses 2.600 token per detik. Sebagai perbandingan, ChatGPT memproses sekitar 130 token per detik, sementara DeepSeek memproses sekitar 25 token per detik, berdasarkan hasil benchmark Artificial Analysis. James Wang, seorang eksekutif senior di Cerebras, menekankan bahwa kecepatan pemrosesan token yang tinggi sangat penting untuk aplikasi yang membutuhkan penalaran dan aksi yang cepat, seperti agen AI real-time.
Dengan kecepatan inferensi yang signifikan ini, API Llama membuka peluang baru untuk pengembangan aplikasi AI yang inovatif, termasuk:
- Agen real-time
- Sistem suara dengan latensi rendah
- Pembuatan kode interaktif
- Dan berbagai aplikasi lain yang membutuhkan respons cepat
Peluncuran API Llama menandai langkah penting bagi Meta untuk terjun ke bisnis komputasi AI, menjadikan model AI tersebut sebagai produk komersial. Sebelumnya, Llama tersedia secara gratis sebagai sumber terbuka (open source) dan telah diunduh sebanyak 1,2 miliar kali. Namun, Meta belum mengumumkan secara detail mengenai harga API Llama dengan kecepatan tinggi ini.
Selain peluncuran API Llama, Meta juga mengumumkan pencapaian signifikan lainnya, yaitu model AI Llama telah diunduh sebanyak 1,2 miliar kali hingga Maret 2025. Jumlah ini meningkat hampir dua kali lipat dibandingkan dengan Desember 2024, ketika Meta mengumumkan bahwa Llama telah diunduh sebanyak 650 juta kali. Chris Cox menambahkan bahwa terdapat ribuan pengembang yang berkontribusi dengan puluhan ribu model turunan yang diunduh ratusan ribu kali setiap bulan. Selain itu, asisten AI Meta, Meta AI, diklaim telah memiliki sekitar satu miliar pengguna.