EIKON Technology

LLM

Google Cloud

Meningkatkan Interpretabilitas LLM dengan Evaluation Service Vertex AI

Developer yang memanfaatkan large language model (LLM) sering kali menghadapi dua rintangan besar: mengelola keacakan bawaan dari output dan mengatasi kecenderungan untuk menghasilkan informasi yang salah secara faktual. LLM memang memiliki sedikit ketidakpastian dan menghasilkan respons yang berbeda, bahkan saat diberi perintah yang sama. Tulisan kali ini akan dibahas cara mengatasi tantangan tersebut dengan memperkenalkan alur kerja baru yang bekerja dengan menghasilkan serangkaian respons LLM dan menggunakan Evaluation Service Vortex AI untuk mengotomatiskan proses pemilihan repsons terbaik. Mari simak bersama! Langkah 1: Hasilkan respons yang beragam Photo Credit: Freepik LLM berbasis dekoder kausal memiliki sedikit keacakan bawaan, yang berarti mengambil sampel setiap kata secara probabilistik. Dengan menghasilkan respons yang sedikit berbeda, maka peluang untuk menemukan kecocokan yang sempurna pun akan lebih besar. Untuk menerapkannya, biasanya lembaga keuangan menggunakan LLM untuk menghasilkan lima ringkasan berbeda untuk setiap transkrip. Mereka menyesuaikan “suhu” LLM, yang mengendalikan keacakan keluaran, ke kisaran 0,3 hingga 1,0, untuk mendorong jumlah keragaman yang tepat tanpa menyimpang terlalu jauh dari topik. Pendekatan ini akan meningkatkan kemungkinan menemukan ringkasan berkualitas tinggi. Baca juga: Membangun Aplikasi Gen AI untuk Perusahaan dengan LLM dari Database Google Cloud Langkah 2: Temukan respons terbaik Berikutnya muncul kebutuhan untuk menelusuri serangkaian respons yang beragam dan kemudian menentukan respons terbaik. Untuk melakukannya secara otomatis, lembaga keuangan menerapkan pendekatan evaluasi berpasangan yang tersedia di Evaluation Service Vortex AI. Layanan ini mengadu pasangan respons satu sama lain, menilainya berdasarkan instruksi dan konteks asli untuk mengidentifikasi respons yang paling sesuai dengan maksud pengguna. Baca juga: Google Cloud Directory Sync Kini Menyediakan Setelan Pengelolaan Akun Langkah 3: Nilai respons yang dihasilkan Alur kerja kemudian mengambil respons dengan kinerja terbaik dari langkah sebelumnya dan menggunakan layanan evaluasi poin demi poin untuk menilainya. Evaluasi ini menetapkan skor kualitas dan menghasilkan penjelasan yang dapat dibaca pengguna. Proses ini tidak hanya menyoroti respons terbaik tetapi juga memberikan wawasan tentang mengapa model menghasilkan respons tersebut, dan juga mengapa respons ini dianggap lebih unggul daripada respons lainnya, yang menumbuhkan kepercayaan dan transparansi dalam pengambilan keputusan sistem. Photo Credit: Freepik Dalam kasus lembaga keuangan, mereka sekarang menggunakan metrik terkait ringkasan dalam evaluasi poin demi poin pada respons yang unggul untuk memperoleh penjelasan tentang bagaimana jawaban ini beralasan, bermanfaat, dan berkualitas tinggi. Kita dapat memilih untuk hanya mengembalikan respons terbaik atau menyertakan metrik kualitas terkait dan penjelasannya untuk transparansi yang lebih baik. Baca juga: Perlindungan Kebijakan API untuk Menghadapi Era Generative AI Dengan merangkul variabilitas yang melekat pada LLM dan memanfaatkan Evaluation Service Vortex AI, tantangan dapat diubah menjadi peluang. Menghasilkan respons yang beragam, mengevaluasinya secara sistematis, dan memilih opsi terbaik dengan penjelasan yang jelas akan membantu Anda membuka potensi penuh LLM. Pendekatan ini tidak hanya meningkatkan kualitas dan keandalan keluaran LLM tetapi juga menumbuhkan kepercayaan dan transparansi. Kemudahan Evaluation Service Vortex AI ini bisa Anda nikmati cukup dengan berlangganan Google Cloud yang kini telah tersedia di EIKON Technology. Untuk informasi lebih lanjut, silakan hubungi kami di sini!

Info

Membangun Aplikasi Gen AI untuk Perusahaan dengan LLM dari Database Google Cloud

Large language model (LLM) dilatih dengan kumpulan besar data dari berbagai topik sehingga sangat berguna dalam banyak hal. Sayangnya LLM membutuhkan data pelatihan yang besar. Salah satu pendekatan populer untuk mengatasi problem tersebut adalah dengan “menurunkan” LLM menggunakan teknik Retrieval Augmented Generation. Teknik ini akan membuka peluang baru bagi perusahaan untuk membangun aplikasi gen AI yang dapat memanfaatkan data baru. Ulasan kali ini akan membahas tentang membangun gen AI perusahaan dengan LLM dari database Google Cloud. Mengenal teknik RAG Salah satu contoh umum pemanfaatan teknik RAG adalah untuk chatbot layanan pelanggan. Dengan RAG, Anda dapat menciptakan bot yang dapat menjawab berbagai pertanyaan, mulai dari ketersediaan barang hingga kebijakan pengembalian. RAG terdiri dari satu langkah persiapan dan empat tahap penerapan. Contoh RAG yang disederhanakan ini mengalir melalui proses bagaimana aplikasi dapat memberikan jawaban mendasar dengan memanfaatkan fitur pencarian kesamaan dari database yang mendukung pengindeksan vektor. Photo Credit: Google Cloud Blog Persiapan: Data internal disimpan dalam database melalui model penyematan. Penerapan: Aplikasi Gen AI menggunakan model penyematan untuk mengonversi pertanyaan dari natural language (contoh: “Apakah Anda memiliki produk X dengan fitur A, B, C?”) menjadi vektor. Model penyematan digunakan untuk mengubah pertanyaan menjadi vektor dan melakukan pencarian semantik pada database. Database mengembalikan data yang akan digunakan sebagai bagian dari prompt untuk LLM. LLM menyusun jawaban yang akurat berdasarkan data. LLM dan database bekerja sama untuk memberikan hasil real-time. Pada pengaturan awal, Anda perlu menyimpan data internal seperti deskripsi produk melalui model penyematan ke dalam database operasional sebagai vektor. Database vektor Photo Credit: Freepik Komponen kunci dari pendekatan RAG adalah penerapan penyematan vektor. Google Cloud menyediakan beberapa opsi untuk menyimpannya. Vertex AI Vector Speech adalah alat yan dibuat khusus untuk menyimpan dan mengambil vektor pada volume tinggi, namun berlatensi rendah. Apabila Anda sudah familier dengan PostgreSQL, ekstensi pgvector menyediakan cara mudah untuk menambahkan kueri vektor ke database untuk mendukung aplikasi gen AI. Cloud SQL dan AlloyDB mendukung pgvector, dengan AlloyDB AI mendukung ukuran vektor hingga 4x lebih besar dan performa hingga 10x lebih cepat dibanding PostgreSQL standar saat menggunakan mode indeks IVFFlat. Baca juga: Google Cloud Meluncurkan Produk Baru untuk Pengembangan Aplikasi Membangun aplikasi Gen AI untuk perusahaan mungkin tampak sulit di awal, tapi dengan memanfaatkan open-source tools seperti LangChain dan memanfaatkan resources Google Cloud, Anda bisa memulai dengan mudah. Untuk mempelajari lebih lanjut mengenai pgvector di Cloud SQL dan AlloyDB, Google Cloud telah menyediakan dokumentasinya di sini. Bangun aplikasi Gen AI untuk perusahaan Anda sekarang juga dengan berbagai resources yang disediakan oleh Google Cloud. Untuk bisa memanfaatkan resources lengkap Cloud dalam pengembangan Gen AI, Anda bisa langsung memilih paket berlangganan melalui EIKON Technology. Kami menyediakan solusi komputasi awan Google Cloud yang dapat disesuaikan dengan kebutuhan Anda. Untuk informasi lebih lanjut, silakan hubungi kami di sini!

Scroll to Top