Google telah muncul sebagai pembangkit tenaga listrik terkemuka di dunia kecerdasan buatan (AI) dan teknologi chatbot, bersama dengan perusahaan seperti Claude dan ChatGPT. Saat ini mereka sedang memasuki “era Gemini” setelah melakukan rebranding dari iterasi sebelumnya, yang dikenal sebagai Bard. Namun, seperti halnya Google, mereka telah menerapkan rangkaian model AI multimodalnya ke banyak produk lainnya.
Inilah yang kami ketahui tentang Google Gemini.
Apa itu Google Gemini?
Google Gemini memasuki dunia AI pada bulan Februari tahun ini dan dengan cepat membuat heboh. Namun peluncuran Gemini Live di acara “Made by Google” pada bulan Agustus lah yang benar-benar menarik perhatian. ReadWrite melaporkan hal itu Gemini Live menghadirkan AI percakapan langsung ke ponsel Androidyang memungkinkan pengguna membicarakan topik kompleks secara real-time menggunakan suara alih-alih mengetik—pengalaman yang jauh lebih alami dan interaktif.
Pada intinya, Gemini adalah model bahasa besar (LLM) Google, yang mendukung serangkaian alat AI serupa dengan yang mungkin pernah Anda lihat, seperti ChatGPT OpenAI. Sama seperti model GPT-4 OpenAI yang mendukung ChatGPT-4 dan ChatGPT Plus, Gemini mendukung chatbot dan alat AI Google. Namun, Gemini mewakili lebih dari sekedar model AI – ini juga merupakan identitas baru untuk chatbot Google, yang sebelumnya disebut Bard. Rebranding ini menyederhanakan banyak hal dengan menyatukan model dan chatbot di bawah nama Gemini.
Gemini Live hadir dalam 40+ bahasa! Ini akan diluncurkan ke perangkat Android dalam beberapa minggu ke depan, dimulai dengan bahasa Prancis, Jerman, Portugis, Hindi, dan Spanyol, dan masih banyak lagi yang akan segera hadir.
Anda akan segera dapat berkomunikasi, berkolaborasi, dan berkreasi dalam lebih banyak lagi… pic.twitter.com/yP4YVFwFCr
— Aplikasi Google Gemini (@GeminiApp) 3 Oktober 2024
Lantas, apa yang bisa dilakukan Gemini? Dapat menjawab pertanyaan, meringkas teks, menulis kode, menerjemahkan, dan membuat gambar (di ponsel, bukan di versi browser gratis). Google juga sedang mengerjakan Imagen 3, responsnya terhadap Midjourney, yang kemungkinan akan segera diintegrasikan ke dalam Gemini untuk menghasilkan kekuatan kreatif yang lebih besar.
Pembuatan gambar dengan Imagen 3 kini tersedia untuk semua pengguna Gemini di seluruh dunia.
Imagen 3 adalah model pembuatan gambar kualitas tertinggi kami dan menghadirkan tingkat fotorealisme yang lebih tinggi, mengikuti instruksi yang lebih baik, dan lebih sedikit artefak yang mengganggu dibandingkan sebelumnya. pic.twitter.com/E8CrcyFcz5
— Aplikasi Google Gemini (@GeminiApp) 9 Oktober 2024
Selain sebagai alat percakapan, Gemini juga terintegrasi di berbagai aplikasi Google, menambahkan fitur cerdas ke alat Google Workspace seperti Gmail, Google Dokumen, dan aplikasi produktivitas lainnya untuk pengguna berbayar.
Aktifkan ekstensi untuk memaksimalkan Gemini.
Hubungkan titik-titik di seberang Anda @Google semesta dan gunakan Gemini untuk menemukan info di Gmail Anda, meringkas Dokumen yang panjang, dan banyak lagi.
Lihat di bawah untuk mempelajari caranya #GeminiProTip pic.twitter.com/RAhigHbIpo
— Aplikasi Google Gemini (@GeminiApp) 22 Oktober 2024
Pengembang bahkan dapat menggabungkan kemampuan Gemini ke dalam aplikasi mereka sendiri. Gemini pada akhirnya dapat menggantikan Asisten Google, mungkin menawarkan asisten yang lebih baik dan didukung AI yang berinteraksi secara lancar dengan ekosistem Google.
Bagaimana cara membandingkannya dengan ChatGPT?
Google punya dibagikan beberapa wawasan menarik tentang cara kerja Gemini, model AI mereka. Seperti banyak model AI terkemuka, Gemini menggunakan arsitektur transformator dan menerapkan teknik pra-pelatihan dan penyesuaian. Namun, apa yang membuat Gemini unik adalah ia dilatih pada berbagai jenis media—teks, gambar, audio, dan video—sekaligus, daripada berfokus pada satu per satu.
Pendekatan ini bertujuan memberi Gemini pemahaman yang lebih bernuansa bahasa dan konteks. Bayangkan ungkapan seperti “obrolan ringan”. Jika AI dilatih untuk mengasosiasikan gambar “kecil” dan “berbicara”, AI mungkin akan mengartikannya secara harfiah, sehingga menghasilkan gambar orang-orang pendek yang sedang bercakap-cakap. Namun karena pelatihan Gemini mengintegrasikan bahasa dan visual secara bersamaan, pelatihan tersebut harus memahami nada “obrolan ringan” yang menyenangkan.
Pelatihan multimodal ini membantu Gemini “memahami dan mempertimbangkan dengan lancar segala jenis masukan dari awal.” Misalnya, ia dapat membaca bagan di samping keterangan, menafsirkan tanda, dan memadukan informasi di seluruh teks, gambar, dan banyak lagi. Meskipun fitur-fitur ini inovatif ketika Gemini diluncurkan, model lain, seperti Claude 3.5 dan GPT-4o, kini memiliki kemampuan multimoda serupa.
Fitur utama lainnya dari Gemini adalah jendela konteksnya yang panjang. Dengan Gemini 1.5 Pro, Anda dapat memasukkan hingga dua juta token dalam satu perintah, mengakomodasi dokumen yang luas, database, dan kontrak yang kompleks. Hal ini sangat berguna jika Anda bekerja dengan sumber daya teks yang besar atau membangun alur pengambilan-augmented generasi (RAG)—meskipun biaya dapat bertambah jika Anda menggunakan kapasitas penuh secara teratur.
Dalam hal kinerja, benchmark menunjukkan bahwa Gemini 1.5 Pro sedikit tertinggal dari model papan atas seperti GPT-4o dan Claude 3.5 Sonnet tetapi setara dengan model seperti Llama 3 70B. Versi yang lebih ringan, Gemini 1.5 Flash, sebanding dengan GPT-4o Mini dan Claude 3 Haiku, menjadikannya pilihan yang solid di antara model kelas menengah.
Apakah Google Gemini gratis?
Sekarang ada aplikasi Gemini gratis untuk Android, yang bahkan dapat menggantikan Google Assistant di ponsel Anda jika Anda mau. Pengguna iPhone dapat menemukan Gemini di aplikasi Google, dan dapat diakses oleh semua orang melalui browser web apa pun.
Selain versi gratisnya, Google menawarkan opsi premium yang disebut Gemini Advanced. Langganan ini, yang merupakan bagian dari paket Google One AI Premium, memberikan akses ke model yang lebih canggih, Gemini Ultra. Pelanggan mendapatkan keuntungan ekstra, seperti menggunakan Gemini Live di perangkat seluler—pengalaman AI yang dikontrol suara dan hands-free untuk Android. Jadi, apakah Anda menggunakan versi gratis atau versi yang ditingkatkan, ada banyak cara untuk mengakses Gemini di seluruh perangkat.
Apa itu Pesan Google Gemini?
Fokus Google dengan Gemini adalah mengintegrasikannya ke dalam aplikasi produktivitas seperti Docs dan Gmail, namun kini sudah mulai diterapkan. Pesan Google—sebuah aplikasi yang diandalkan sebagian besar pengguna Android setiap hari. Awalnya diumumkan pada I/O 2024, Gemini di Pesan memudahkan Anda mendapatkan bantuan AI dalam segala hal mulai dari menyusun teks hingga merencanakan akhir pekan Anda.
Sebelum Anda dapat mulai mengobrol dengan Gemini di Pesan, Anda harus memenuhi beberapa persyaratan: Anda harus berusia 18 tahun ke atas, mengaktifkan obrolan RCS, menggunakan Akun Google pribadi, memiliki ponsel Android dengan RAM minimal 6 GB, dan diatur ke Bahasa Inggris (di negara yang didukung) atau Prancis (Kanada).
Setelah Anda siap, berikut cara mengobrol dengan Gemini:
- Buka Pesan Google
- Ketuk “Mulai obrolan” di sudut kanan bawah
- Pilih Gemini di bagian atas sebagai kontak
- Pilih contoh prompt atau ketik permintaan Anda
- Ngobrol sampai Anda mendapatkan teks atau gambar yang Anda butuhkan.
Gemini juga berada di balik Magic Compose, sebuah fitur yang diperkenalkan Google pada tahun 2023 untuk membantu Anda menulis ulang dan mengubah gaya pesan. Meskipun Magic Compose dapat menyesuaikan pesan Anda dalam beberapa cara, fleksibilitasnya lebih terbatas dibandingkan obrolan lengkap dengan Gemini.
Meskipun Gemini di Pesan berarti Anda tidak perlu beralih ke aplikasi Gemini khusus atau menyetelnya sebagai asisten default, ini bukanlah pengalaman yang lengkap. Tanggapan diformat seperti teks, yang dapat menyebabkan beberapa kendala. Untuk saat ini, ini adalah alat yang mudah digunakan untuk mendapatkan ide dan respons cepat, meskipun aplikasi tersebut tidak memiliki fleksibilitas seperti yang Anda temukan di aplikasi lain yang didukung Gemini.
Apakah itu bagus?
Google Gemini unggul dalam persaingan AI, terutama dengan kemampuan multimoda yang kuat dan integrasi yang lancar di seluruh aplikasi Google. Sementara itu, ChatGPT membuat kemajuan dengan teknologinya fitur SearchGPT baruyang menyediakan akses data waktu nyata untuk pertama kalinya.
Namun, Google memiliki keunggulan yang signifikan dalam indeks pencariannya yang luas, mencakup ratusan miliar halaman—sebuah fondasi yang kuat untuk keandalannya. Mereka juga dilaporkan sedang mengerjakan alat AI baru, dengan nama kode “Proyek Jarvis,” dirancang untuk mengoperasikan browser web untuk mengelola tugas sehari-hari.
Proyek ini mungkin akan dipratinjau pada awal Desember, bersamaan dengan model Gemini andalan Google berikutnya, yang diperkirakan akan menggerakkan Jarvis. Jika berhasil, kemampuan AI-nya bisa melampaui model-model lain, namun kita harus menunggu dan melihat bagaimana performanya.
Gambar unggulan: Google / Canva
Pos Apa itu Google Gemini? Cara kerja model AI dan chatbot pada tahun 2024 muncul pertama kali pada BacaTulis.
Mohon maaf, Foto memang tidak relevan. Jika keberatan atau harus diedit baik Artikel maupun foto Silahkan Klik Laporkan. Terima Kasih