Cara Google Menskalakan Personalisasi Iklan dengan Bigtable

Cloud Bigtable adalah database populer yang tersedia di Google Cloud. Layanan ini telah digunakan untuk produksi berkelanjutan di Google selama lebih dari 15 tahun. Salah satu kasus penggunaan utama untuk Bigtable di Google adalah personalisasi iklan. Artikel ini akan menjelaskan peran utama yang dimainkan Bigtable dalam personalisasi iklan.

Personalisasi iklan

Personalisasi iklan bertujuan untuk meningkatkan pengalaman pengguna dengan menyajikan konten iklan yang relevan dan sesuai topik. Namun kapabilitas ini memerlukan pemrosesan data berskala besar hampir secara real-time. Ketersediaan sistem harus tinggi, dan latensi penayangan harus rendah karena jendela sempit di mana keputusan perlu dibuat terkait konten iklan yang akan diambil dan ditayangkan.

Platform personalisasi iklan Google menyediakan framework untuk mengembangkan dan menerapkan model pembelajaran mesin relevansi dan peringkat konten iklan. Platform ini dibuat menggunakan Bigtable, yang memungkinkan produk Google mengakses sumber data personalisasi iklan dengan cara yang aman dan mematuhi kebijakan.

Bigtable 

Fleksibilitas Bigtable dalam mendukung akses data berbiaya rendah dan throughput tinggi untuk personalisasi offline serta akses latensi rendah yang konsisten untuk penyajian data online membuatnya sangat cocok untuk beban kerja iklan.

Baca juga: Lebih Jauh Mengenai Autoscaling pada Bigtable dan Analisis Penghematan Biayanya

Data model

Platform personalisasi menyimpan objek di Bigtable sebagai protobuf serial yang dikunci oleh Object id. Ukuran data umum kurang dari 1 MB dan latensi penayangan kurang dari 20 mdtk pada p99. Data diatur sebagai corpora dengan kategori data yang berbeda. Corpus dipetakan ke Bigtable yang telah direplikasi.

Di dalam corpus data diatur sebagai DataTypes, pengelompokan data yang logis. Fitur, penyematan, dan berbagai jenis profil iklan disimpan sebagai DataTypes, yang dipetakan ke kelompok kolom Bigtable. DataTypes didefinisikan dalam skema yang menggambarkan struktur proto data dan metadata tambahan yang menunjukkan kepemilikan dan asal. SubTypes dipetakan ke kolom Bigtable dan berbentuk bebas.

Konsistensi

Photo Credit: Freepik

Modus konsistensi default untuk operasi adalah ujung akhirnya. Dalam mode ini, data dari replika Bigtable yang terdekat dengan pengguna diambil, memberikan median dan latensi ekor terendah.

Membaca dan menulis ke satu replika Bigtable dilakukan secara konsisten. Jika ada beberapa replika Bigtable di suatu wilayah, limpahan lalu lintas lintas wilayah lebih mungkin terjadi. Untuk meningkatkan kemungkinan konsistensi baca-setelah-tulis, platform personalisasi menggunakan gagasan afinitas baris. Jika ada beberapa replika di suatu wilayah, satu replika akan dipilih secara istimewa untuk setiap baris tertentu, berdasarkan hash Row ID.

Baca juga: Apa Itu Fungsi Autoscaling yang Baru Diluncurkan di Cloud Bigtable?

Replikasi Bigtable

Workload personalisasi Iklan menggunakan topologi replikasi Bigtable dengan lebih dari 20 replika, yang tersebar di empat benua.

Replikasi membantu mengatasi kebutuhan ketersediaan tinggi untuk penayangan iklan. Persentase waktu aktif bulanan zonal Bigtable melebihi 99,9%, dan replikasi yang digabungkan dengan kebijakan perutean multi-cluster memungkinkan ketersediaan lebih dari 99,999%.

Isolasi workload

Photo Credit: Freepik

Batch workload personalisasi iklan diisolasi dari workload penayangan dengan menyematkan sekumpulan workload tertentu ke replika tertentu; beberapa replika Bigtable secara eksklusif mendorong jalur personalisasi sementara yang lain mendorong penyajian data pengguna. Model ini memungkinkan loop umpan balik yang berkelanjutan dan mendekati waktu real-time antara sistem penyajian dan saluran personalisasi offline.

Residensi data

Secara default, data direplikasi ke setiap replika. Hal ini merupakan pemborosan untuk data yang hanya diakses secara regional. Regionalisasi menghemat biaya penyimpanan dan replikasi dengan membatasi data ke wilayah yang paling mungkin diakses.

Lokasi data dapat ditentukan secara implisit oleh lokasi akses permintaan atau melalui metadata lokasi dan sinyal produk lainnya. Setelah lokasi untuk pengguna ditentukan, lokasi tersebut disimpan dalam tabel metadata lokasi yang menunjuk ke replika Bigtable. Migrasi data berdasarkan kebijakan penempatan baris terjadi di latar belakang, tanpa waktu henti dan regresi kinerja.

Baca juga: Tampilan Baru Google Cloud SDK + CLI untuk Pengembangan yang Lebih Mudah

Selama beberapa tahun terakhir, Bigtable telah ditingkatkan karena kebutuhan personalisasi Google telah ditingkatkan berdasarkan urutan besarnya. Untuk beban kerja personalisasi skala besar, Bigtable menawarkan penyimpanan berbiaya rendah dengan karakteristik kinerja yang sangat baik. Kemudahannya dalam menangani penyajian latensi rendah dan komputasi batch throughput tinggi menjadikannya pilihan yang sangat baik untuk pipeline pemrosesan data bergaya lambda.

Untuk kebutuhan personalisasi yang optimal, Google Cloud terbukti mampu menyediakan solusi terbaik. Dengan memanfaatkan Bigtable, Anda tidak hanya dapat merancang personalisasi iklan yang tepat sasaran, tapi juga hemat biaya. Jadikan Google Cloud sebagai solusi komputasi awan perusahaan Anda. Dapatkan produk resmi Google Cloud hanya di EIKON Technology, authorized partner Googel untuk Indonesia. Untuk informasi selengkapnya, silakan klik di sini!

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments