Teknologi

AI dan Mesin Belajar Pada Data Media Sosial Memberikan Perlindungan

AI dan Mesin Belajar Pada Data Media Sosial Memberikan Perlindungan

eKoran.co.id – Penggalian nilai dari data semesta, menganalisis sentimen sekitar nama perusahaan (ekuitas) atau hal-hal lain (makro), adalah sebuah perjalanan yang kompleks dan kami hanya sekitar 5% pada jalan itu.

Parameter yang berkembang dimana data yang terus berkembang, termasuk Twitter, gambar, teks, video diproses; mengandalkan para ahli versus kebijaksanaan kerumunan; Sentimen berasal dari “kantong kata”, sebagai lawan analisis linguistik terstruktur.

Konferensi Unicom pekan lalu, AI, Machine Learning dan Sentimen Analisis Terapan Membiayai (Juli 14) membawa bersama-sama sekelompok ahli di bidang ini. Profesor Gautum Mitra, OptiRisk Systems memperkenalkan Elia DePalma dan James Cantarella, Thomson Reuters; Pierce Crosby, StockTwits; Anders Bally, Sentifi; Peter Hafez, RavenPack; Stephen Morse, Twitter.

DePalma agak berbeda dari yang lain karena mesin sentimen Thomson Reuters menggunakan data berita hanya terakreditasi Reuters, daripada mentah obrolan media sosial. DePalma menjelaskan: “Ketika kita mengekstrak fitur, pendekatan sederhana yang sering dilakukan pada literatur akademik, adalah pendekatan ‘kantong kata’.

Contoh ini dalam tindakan bisa menjadi kalimat: “IBM melampaui Microsoft”. Sebuah tas sederhana dari pendekatan kata akan memberikan IBM dan Microsoft dengan skor sentimen yang sama. mesin analisis berita DePalma ini mengakui “IBM” adalah subjek, “Microsoft” adalah objek dan “melampaui” sebagai kata kerja dan / hubungan negatif positif antara subjek dan objek, yang nilai sentimen mencerminkan: IBM positif, Microsoft, negatif.

BACA JUGA :  Huawei Berencana Tinggalkan Android dan Buat Sistem Operasi Sendiri

“Jadi Anda membuat parse tree tata bahasa dan salah satu manfaat dari ini, ketimbang tas kata-kata di mana Anda mungkin memiliki puluhan ribu fitur, Anda memiliki representasi fitur dimensi rendah ketika Anda membuat pohon-pohon parse dengan tata bahasa.

“Tapi itu juga membuat skor sentimen sekitar 20% lebih akurat; dari mengatakan 60% akurat hingga 80% Dan perlu diingat bahwa di antara pembaca manusia, konsistensi internal akurasi sekitar 85%.”

DePalma menunjukkan pendekatan parsing juga mempengaruhi bagaimana Reuters melakukan pendekatan bahasa asing, seperti dalam kasus layanan berita analyitics Jepang.

“Mengapa tidak mengambil mesin terjemahan otomatis seperti Google Translate, menerjemahkan bahasa Jepang ke Inggris dan menerapkan mesin Anda? Karena kita akan kehilangan struktur bahasa dan dasarnya dikurangi menjadi tas kata akurasi dalam mengetik.”

Comments

Berita Terhangat

To Top