Meningkatkan Privasi Data dalam Generative AI

Seiring dengan berkembangnya landscape generative AI (GenAI), menjaga privasi dan keamanan data tetap menjadi perhatian utama bagi organisasi seperti milik Anda. Di NetApp, kami berkomitmen untuk terus berinovasi guna membantu pelanggan kami menggunakan model GenAI dengan data perusahaan mereka, tidak hanya untuk meningkatkan kemampuan AI, tetapi juga untuk melindungi informasi pribadi dan sensitif.

Pada bulan Juli tahun ini, kami meluncurkan salah satu inovasi tersebut, NetApp® BlueXP™ Workload Factory, untuk membantu Anda mempercepat pengembangan aplikasi GenAI yang didasarkan pada pengetahuan dari dataset perusahaan. Dengan menggunakan BlueXP Workload Factory, dalam hitungan menit, Anda dapat menghubungkan dataset tak terstruktur di penyimpanan NetApp ONTAP® Anda untuk memperkaya model bahasa besar (LLM) yang tersedia melalui Amazon Bedrock. BlueXP Workload Factory menerapkan pipeline retrieval-augmented generation (RAG) dari ujung ke ujung yang mengolah dan mentransformasi dataset tak terstruktur, serta membuat dan menyimpan vector embeddings. Ini juga menyediakan API kaya untuk membangun aplikasi seperti asisten virtual yang dapat mengambil pengetahuan dari dataset yang terhubung.

Dan kami terus berinovasi. Hari ini, kami sangat senang mengumumkan integrasi NetApp BlueXP Workload Factory dengan BlueXP Classification Service. Integrasi baru ini dirancang untuk memfilter Informasi Pribadi yang Dapat Diidentifikasi (PII) dari dataset perusahaan sebelum dimasukkan ke dalam pipeline RAG. Kemampuan ini menetapkan standar baru untuk melindungi privasi dalam aplikasi GenAI.

Meningkatkan Privasi dan Keamanan Data untuk GenAI

GenAI sedang merevolusi cara organisasi memanfaatkan data mereka, menghasilkan wawasan yang kuat dan mendorong inovasi. Namun, penyertaan PII dalam dataset menimbulkan risiko privasi yang signifikan dan tantangan dalam menjaga keamanan data pelanggan serta memenuhi standar regulasi. Kebocoran informasi pribadi ke dalam model dan aplikasi meningkatkan risiko pencurian data dan serangan ransomware, denda dari regulator, serta kerugian bisnis. Dengan memperkenalkan pagar data (data guardrails) yang kuat untuk menegakkan kontrol privasi yang ketat pada pipeline RAG, pembaruan terbaru pada BlueXP Workload Factory membantu Anda mengatasi tantangan-tantangan ini.

Pagar Data untuk Basis Pengetahuan

Ketika Anda membuat basis pengetahuan dalam BlueXP Workload Factory, sekarang Anda dapat menegakkan pagar data yang mengidentifikasi dan mengecualikan PII dari sumber data yang terhubung ke basis pengetahuan. Kemampuan ini mencegah informasi pribadi dimasukkan ke dalam basis pengetahuan, menjaga integritas dan privasi data.

Untuk menggunakan fitur pagar data ini, Anda harus menginstal BlueXP Classification Service. Pagar data bergantung pada BlueXP Classification untuk mendeteksi, memfilter, dan meredaksi informasi pribadi selama proses pengambilan data, menjadikannya bagian integral dari alur kerja. BlueXP Classification adalah layanan gratis dari NetApp yang mengidentifikasi dan mengklasifikasikan PII dalam dataset yang ada di penyimpanan NetApp Anda. Data yang terdeteksi termasuk nomor kartu kredit, alamat email, alamat IP, kata sandi, nomor identifikasi nasional, dan lainnya.

Integrasi dengan Workload Factory mendukung deteksi dan redaksi PII yang terdeteksi dalam format file yang didukung oleh basis pengetahuan. Untuk mendapatkan daftar lengkap data pribadi dan sensitif yang dapat dideteksi oleh BlueXP Classification, Anda dapat merujuk ke dokumentasi BlueXP Classification.

 

Cara Kerjanya

Fitur pagar PII terintegrasi dengan mulus ke dalam alur kerja pembuatan basis pengetahuan di BlueXP Workload Factory. Untuk mengonfigurasi pagar data, Anda harus terlebih dahulu menginstal BlueXP Classification Service (versi 1.36 atau lebih baru) di akun AWS dan Virtual Private Cloud (VPC) Anda, tempat Anda memiliki sistem file Amazon FSx untuk NetApp ONTAP yang menyediakan dataset sumber yang akan dihubungkan ke basis pengetahuan. BlueXP Classification berjalan pada instance m6i.4xlarge yang diterapkan di VPC Anda. BlueXP Workload Factory secara otomatis menemukan BlueXP Classification Service dan mengatur saluran komunikasi antara mesin AI NetApp yang diterapkan di VPC Anda dan instance klasifikasi.

Setelah BlueXP Classification diterapkan, selama pembuatan basis pengetahuan di BlueXP Workload Factory, Anda dapat mengonfigurasi penegakan pagar data.

Dengan inovasi ini, NetApp membantu Anda mengoptimalkan penggunaan data dalam pengembangan aplikasi GenAI, sambil memastikan privasi dan keamanan data tetap terjaga sesuai dengan standar yang ketat.

health records

Seperti yang ditunjukkan pada gambar berikut, BlueXP Workload Factory mengimpor dokumen teks ke dalam basis pengetahuan, dan setiap potongan dokumen pertama-tama diteruskan ke mesin klasifikasi untuk mendeteksi informasi pribadi. Jika mesin klasifikasi menemukan informasi semacam itu, informasi tersebut akan dihapus dan diganti dengan “<PII REMOVED>.” Potongan dokumen tersebut kemudian diteruskan ke model embedding, yang mengubah potongan dokumen menjadi vektor yang disimpan dalam knowledge base vector store. Pagar data (data guardrails) menyaring data PII sebelum diproses menjadi vektor dalam database vektor, sehingga hanya informasi yang tidak sensitif yang dimasukkan ke dalam pipeline RAG dan tersedia untuk embedding dan model bahasa.

aws cloud

 

Membangun dengan Kepercayaan

Aplikasi seperti asisten virtual yang dibangun menggunakan basis pengetahuan yang telah dikonfigurasi dengan pagar data (data guardrails) tidak dapat mengekspos data PII (yang terdeteksi oleh BlueXP Classification) kepada pengguna akhir. Gambar berikut menunjukkan bagaimana asisten virtual tidak dapat mengambil data PII karena informasi tersebut sudah dihapus.

IBAN Chat

 

Memberdayakan Perusahaan dengan AI yang Aman dan Bertanggung Jawab

Di NetApp, kami memahami pentingnya keamanan data dan perlindungan privasi data, terutama ketika data perusahaan terhubung ke model dan aplikasi GenAI. Dengan mengintegrasikan BlueXP Classification dengan BlueXP Workload Factory, kami menyediakan platform RAG yang kuat yang menyederhanakan penerapan GenAI yang relevan dengan konteks perusahaan Anda, sekaligus menjaga informasi sensitif tetap terlindungi. Kami sangat antusias melihat bagaimana kemampuan baru ini akan memberdayakan organisasi seperti milik Anda untuk membangun aplikasi AI yang lebih aman dan efektif.

integrasi BlueXP Workload Factory dan BlueXP Classification, organisasi Anda dapat memanfaatkan data untuk meningkatkan interaksi pengguna tanpa mengorbankan privasi data dan tanpa meningkatkan risiko mengekspos data pribadi ke model bahasa. Ketika kemampuan ini digabungkan dengan Amazon Bedrock Guardrails yang diterapkan pada inferensi atau agen, Anda dapat menambahkan lapisan perlindungan tambahan, seperti filter konten, topik yang ditolak, dan filter dunia.

Untuk mengetahui lebih lanjut tentang kemampuan BlueXP Classification, tinjau dokumentasi BlueXP Classification. Untuk memulai membuat pipeline RAG yang aman dengan dataset perusahaan Anda, daftar untuk BlueXP Workload Factory dan tinjau dokumentasi BlueXP Workload Factory.