Bagaimana AI Dapat Mempelajari Bahasa Manusia Untuk Mempermudah Hidup Kita

Nama Penulis : Khotibul Umam, Mahasiswa Teknik Informatika Universitas Pammulang.

Bagaimana AI Dapat Mempelajari Bahasa Manusia Untuk Mempermudah Hidup Kita

            Di balik kemudahan teknologi digital yang kita gunakan sehari-sehari seperti mesin penerjemahan, e-mail, search engine, dan chatbot (misalnya Siri, Alexa, Google Assistant) ada kompleksitas mesin yang mampu menampilkan data, kata, gambar, dan video dalam hitungan milidetik.

            Teknologi AI merupakan salah satu teknologi masa depan yang dapat mengubah industri bersamaan dengan teknologi “mobile”, “Internet of Things”, dan “cloud”.Seperti namanya, teknologi AI atau kecerdasan buatan ini mampu membuat komputer dapat bertindak atau mengambil keputusan seperti manusia. Salah satu bagian dari AI adalah bidang natural language processing (NLP) atau pemrosesan bahasa alami.

            Teknologi NLP ini yang memungkinkan komputer dapat memahami dan mensintesis teks yang ditulis dalam bahasa manusia.Meski istilah NLP belum banyak dikenal masyarakat luas, sebenarnya masyarakat pengguna internet sudah sangat sering menggunakan teknologi NLP ini bukan hanya aplikasi chatbot yang memang merupakan salah satu target utama dari teknologi NLP, teknologi NLP terdapat juga dalam berbagai aplikasi yang digunakan sehari-hari, salah satu yang sering digunakan adalah search engine, seperti Google, Bing atau Yahoo.

            Teknologi NLP lainnya yang sering digunakan adalah mesin penerjemahan otomatis (machine translation), seperti Google translate fitur ini sering digunakan baik pada saat membaca atau memahami sebuah teks, atau bahkan pada saat menulis teks dalam bahasa tertentu.

            Mesin penjawab otomatis dan penelisik sentimen Saat ini, di Indonesia, semakin banyak industri yang memahami manfaat dari penggunaan teknologi NLP ini mempunyai 2 jenis teknologi NLP yang banyak digunakan industri di Indonesia adalah chatbot dan media monitoring.

            Chatbot adalah teknologi NLP yang mampu melayani percakapan dengan pengguna secara otomatis. Media monitoring analisis sentimen adalah aplikasi yang menggunakan teknologi NLP untuk membantu mengambil informasi khusus dari berbagai pendapat yang tersebar di media sosial.

            Kelebihan penggunaan media sosial dibandingkan survei adalah ketepatan pendapat yang bisa berubah dalam rentang waktu tertentu, kesimpulan dapat diperoleh lebih cepat, dan biaya yang lebih murah. Salah satu teknologi NLP yang banyak digunakan pada aplikasi media monitoring adalah klasifikasi sentimen, teknologi untuk kategorisasi sebuah pendapat pelanggan menjadi positif atau negatif secara otomatis.

            Pada dasarnya, strategi teknik yang sering digunakan dalam membangun teknologi NLP ini dapat dibagi menjadi dua teknik pemrosesan NLP, yaitu (1) strategi berbasis aturan yang secara manual dituliskan oleh manusia (rule based technique) atau (2) strategi berbasis aturan yang secara otomatis diperoleh dari data (statistical based technique atau machine learning based technique).

            Dalam teknik ini, berbagai aturan (termasuk daftar kata penting) diperoleh secara otomatis melalui data.Langkah pertama bagi para saintis untuk menggunakan teknik berbasis machine learning adalah membuat data latih (Data latih yang berkualitas merupakan salah satu kunci keberhasilan sebuah aplikasi NLP).

            Berikut adalah contoh data latih untuk klasifikasi spam:”Ini mama, kartu telpon mama hilang, jadi pakai nomor ini” Tolong kirim pulsa ke nomor ini” → ditandai sebagai “SMS spam”.”Kak, bisa kirim pulsa ke mama, ini udah mau habis, Mama perlu telpon kakak” → ditandai sebagai “SMS bukan spam”.Setelah data latih terbangun, selanjutnya saintis menggunakan algoritme machine learning untuk mengambil daftar kata penting dan aturan lainnya dari data latih tersebut secara otomatis.Berbagai algoritme machine learning tradisional dapat digunakan seperti decision tree, SVM, dan XGBoost.

            Algoritme deep learning ini telah dibuktikan oleh banyak penelitian memiliki kinerja yang lebih baik daripada menggunakan algoritme machine learning tradisional.Dalam teknik yang berbasis machine learning, data latih yang berkualitas (data dalam bentuk kata/kalimat) memiliki peran penting dalam membangun model yang akurat untuk pendekatan unsupervised learning (data latih tanpa label), data latih dapat dengan mudah dikumpulkan karena tidak memerlukan pelabelan khusus maksudnya, sistem atau peneliti belum sempat melabelkan apakah satu kata/kalimat tersebut spam atau tidak, misalnya dalam kasus SMS spam.Namun untuk pendekatan supervised learning (data latih dengan label) seperti contoh klasifikasi SMS spam, penyiapan data latih yang berkualitas memerlukan upaya khusus.

            Ketersediaan data latih ini menjadi masalah tersendiri di Indonesia.Saat ini, para peneliti Indonesia di bidang ilmu komputer mengumpulkan data latih masing-masing. Belum terdapat data latih untuk NLP bahasa Indonesia dengan kuantitas yang besar dan kualitas yang baik jika berbagai data latih berbahasa Indonesia ini sudah mencukupi, penelitian NLP Indonesia akan maju, mendorong berbagai produk NLP bahasa Indonesia sehingga urusan hidup kita akan makin mudah dilayani oleh mesin-mesin kecerdasan buatan.

Sumber : https://theconversation.com/bagaimana-ai-dapat-mempelajari-bahasa-manusia-untuk-mempermudah-hidup-kita-112872


Warnings:

Linguistic Core can not confidently detect language of text or detected language is not supported. Used language-independent algorithm.