On This Page
SBM blog CTA mobile 1

Drive growth and reduce costs with omnichannel business messaging

On This Page

Menjelajahi GPT-4o OpenAI dan Aplikasinya dalam Bot Berbasis Pengetahuan

Gpt 4o cover image
May 14, 2024
Jerry Jeon
Software Engineer
On This Page
SBM blog CTA mobile 1

Drive growth and reduce costs with omnichannel business messaging

On This Page
SBM blog CTA mobile 1

Drive growth and reduce costs with omnichannel business messaging


Artikel ini diterjemahkan oleh GPT-4o. Anda dapat melihat artikel aslinya dengan mengikuti tautan ini.

Dalam beberapa bulan terakhir, serangkaian model bahasa besar baru (LLM) telah dirilis, dari Claude 3 hingga Llama 3. Model-model ini telah meningkat secara signifikan, menarik minat besar pada langkah-langkah berikutnya dari OpenAI. Pada 13 Mei 2024, OpenAI mengumumkan GPT-4o, yang secara luas diakui sebagai perubahan revolusioner. Artikel ini akan meneliti bagaimana GPT-4o berbeda dari model sebelumnya dan apa artinya bagi bot berbasis pengetahuan.

Pengenalan GPT-4o

Huruf "o" pada GPT-4o berarti "Omni", yang berarti "semua" atau "seluruh". GPT-4o dapat memproses masukan dan keluaran teks, audio, dan gambar. Saya telah merangkum perbaikan dan fitur dari GPT-4o seperti yang diungkapkan dalam video demo OpenAI.

Peningkatan Kunci pada GPT-4o

Model sebelumnya sebelum GPT-4o adalah GPT-4-turbo-2024-04-09, yang dirilis pada 9 April 2024. Berikut adalah perbaikan yang diperkenalkan oleh OpenAI dibandingkan dengan model sebelumnya:

  • Dua kali lebih cepat dari GPT-4 terakhir
  • Pengurangan biaya sebesar 50%
  • Batas kecepatan lima kali lebih tinggi dibandingkan dengan GPT-4 Turbo
  • Dukungan untuk video dan audio waktu nyata

Interaksi Suara Baru

Aplikasi ChatGPT menyediakan antarmuka yang disebut mode Suara, yang sebelumnya mengharuskan pengguna untuk memasukkan suara mereka dan menunggu jawaban. Sekarang, jawaban diberikan hampir secara instan, dalam waktu nyata. Menurut OpenAI, waktu respons rata-rata adalah sekitar 320 milidetik, mirip dengan waktu reaksi manusia. Pengguna tidak perlu menunggu sampai GPT selesai berbicara; mereka dapat menginterupsi dan berinteraksi selama respons. Sistem ini juga memungkinkan ekspresi emosi dan pembuatan berbagai suara. Demo menunjukkan perintah seperti "bicara lebih dramatis" dan "bicara dengan nada robotik".

Fitur Video

Demo tersebut menyoroti kemampuan GPT-4o untuk membantu secara waktu nyata dalam menyelesaikan masalah matematika yang ditulis di atas kertas dan menyediakan analisis kode dengan mengamati layar komputer secara langsung.

Peluncuran API GPT-4o

OpenAI juga mengumumkan dukungan untuk GPT-4o dalam API-nya, sesuai dengan pengumuman komunitas. Manfaat yang disebutkan sebelumnya seperti kecepatan dua kali lipat, pengurangan biaya sebesar 50%, dan peningkatan batas kecepatan lima kali lipat secara langsung berlaku. Meskipun perbaikan ini menguntungkan semua pengguna, mereka sangat signifikan bagi pengguna API dengan tingkat penggunaan yang tinggi.

Perubahan signifikan lainnya adalah dukungan untuk masukan audio. Sebelumnya, untuk chatbot berbasis suara, perlu menggunakan fitur STT (Speech-to-Text) untuk mengirim teks ke API. Sekarang, audio dapat dikirim langsung ke API, membuatnya jauh lebih efisien dan memungkinkan transmisi suara yang sulit diubah menjadi teks. Tujuan OpenAI adalah mendukung fitur ini dalam beberapa minggu, dan saya sangat antusias dengan tambahan yang sangat dinantikan ini untuk API.

Kesimpulan dan Ringkasan Pengantar GPT-4o

GPT-4o merupakan peningkatan signifikan dibandingkan model sebelumnya dalam berbagai aspek. Meskipun beberapa fitur belum dirilis, fungsionalitas yang ditunjukkan dalam video demo menunjukkan perubahan revolusioner. Sementara pengenalan cepat model baru tampaknya mengancam posisi OpenAI, inovasi ini memastikan bahwa OpenAI tetap berada di garis depan dalam hal perhatian dan fungsionalitas.

Fitur masukan audio dan percakapan waktu nyata sangat mengesankan. Implementasi sukses fitur percakapan suara GPT-4o banyak berhutang pada antarmuka pengguna yang luar biasa. Sam Altman menyebutkan dalam blog bahwa mode suara baru adalah antarmuka terbaik yang pernah dia gunakan, menekankan pentingnya antarmuka dalam teknologi AI.

Antarmuka sering diabaikan saat mengintegrasikan fitur seperti chat atau chatbot ke dalam layanan. Meskipun mungkin terlihat cukup untuk menggunakan API model AI untuk mengirimkan pesan, membangun antarmuka chat yang baik membutuhkan sumber daya yang signifikan. Sendbird tahu ini dan menyediakan antarmuka chat yang sangat baik untuk integrasi dengan GPT-4o, Llama 3, dan Claude 3.

Aplikasi GPT-4o dalam Bot Berbasis Pengetahuan

LLM memiliki keterbatasan, seperti pengetahuan yang dibatasi hingga tanggal tertentu dan ketidakmampuan untuk mengakses informasi pribadi. Untuk mengatasi keterbatasan ini, bot berbasis pengetahuan telah dikembangkan. Pengguna dapat memasukkan informasi spesifik ke dalam bot ini dalam berbagai format seperti URL, PDF, dan file CSV.

Dalam artikel sebelumnya yang membandingkan kinerja Claude, GPT, dan Llama, saya menjelajahi LLM mana yang paling cocok untuk menyusun bot berbasis pengetahuan, termasuk GPT-4-turbo. Artikel tersebut menyimpulkan bahwa GPT-4-turbo menunjukkan kinerja terbaik dalam hal akurasi dan kepadatan.

Karena GPT-4o merupakan kemajuan dibandingkan GPT-4-turbo, saya mengharapkan bahwa ini juga akan menunjukkan kinerja yang luar biasa untuk bot berbasis pengetahuan. Ketika saya menerapkan tes yang sama, hasilnya sesuai dengan yang diharapkan, menunjukkan kemampuan tanya jawab yang luar biasa.

Mari kita lihat sebuah contoh. Saya mendaftarkan file PDF dari laporan "2022 Commuting in the USA" oleh Biro Sensus AS di dasbor Sendbird dan mengajukan berbagai pertanyaan.

Perhatikan kualitas respons yang tinggi. Anda dapat memeriksa daftar lengkap pertanyaan dan jawaban di GitHub saya.

Jika Anda tertarik untuk merasakan hasilnya sendiri, membuat dan menguji chatbot Anda sendiri adalah pendekatan yang sangat baik. Sendbird menawarkan proses sederhana untuk membuat chatbot AI khusus yang disesuaikan dengan basis pengetahuan spesifik Anda dalam 5 langkah cepat dan hanya beberapa menit.

Kecepatan: GPT-4-turbo vs. GPT-4o

Chatbot di sebelah kiri menggunakan GPT-4 turbo, dan yang di sebelah kanan menggunakan GPT-4o. Ketika ditanya pertanyaan yang sama secara bersamaan, ada perbedaan yang jelas dalam kecepatan pembuatan respons.

Dalam artikel saya sebelumnya membandingkan berbagai model LLM, saya menyebutkan bahwa kelemahan GPT-4 adalah harga dan kecepatan, tetapi tampaknya ini telah sepenuhnya diatasi dalam hal kecepatan.

Chatbot AI Kustom Tanpa Kode Pertama untuk Web dan Mobile yang Mendukung GPT-4o

Antarmuka chatbot Anda sangat penting. Pengguna mengharapkan pengalaman chat yang mirip dengan WhatsApp dan Telegram, bahkan saat berbicara dengan chatbot. Saat membangun chatbot AI khusus, penting untuk mempertimbangkan chatbot seperti milik Sendbird yang dapat menawarkan baik LLM canggih seperti GPT-4o dan antarmuka chat kelas dunia.

Untuk memaksimalkan fungsionalitas GPT-4o, fitur chat yang trendi dan berguna harus mencakup:

  • Kartu pesan untuk menampilkan gambar produk
  • Balasan yang disarankan
  • Tanda status pesan untuk pesan yang dikirim, diterima, dan dibaca
  • Indikator mengetik
  • Dukungan offline

Integrasikan GPT-4o ke Situs Web Anda dalam Hanya Beberapa Menit!

Sendbird dapat membantu Anda membangun chatbot AI yang didukung oleh GPT-4o tanpa kode. Anda juga dapat melatih chatbot Anda dengan konten Anda menggunakan URL dan file melalui dasbor chatbot AI Sendbird.

Buat chatbot GPT-4o pertama Anda hari ini!

Ebook Grow Mobile content offer background

Take customer relationships to the next level.

Ready for the next level?