KECERDASAN BUATAN DALAM PROSES PENERJEMAHAN BUKU INGGRIS-INDONESIA DAN SOLUSINYA
Penulis : Alif Nur Qalbani – Universitas Pamulang
Terjemahan mesin adalah istilah lama. Istilah ini telah muncul sejak pertengahan abad ke-20 (Koerner dan Asher 1995, 445). Istilah ini merujuk pada suatu metode modern dalam penerjemahan yang dilakukan dengan bantuan komputer. Terjemahan mesin menggabungkan bidang penerjemahan dengan ilmu komputer, yaitu proses penerjemahan dilakukan oleh komputer (Lin dan Chien 2009, 134). Dengan kata lain, terjemahan mesin adalah terjemahan otomatis (Irfan 2017, 2). Dalam operasi reguler, terjemahan mesin melibatkan komputer dan perangkat lunak terjemahan mesin. Selama proses penerjemahan, mesin bekerja secara otomatis. Sistem mengubah teks sumber dalam bahasa tertentu menjadi teks target tertentu lainnya. Salah satu contoh terjemahan mesin adalah Google Translate
tersebut digabungkan untuk mendapatkan hasil terjemahan dengan kesalahan tata bahasa yang lebih sedikit (Su dan Chang 1992, 13). Statistical MT (SMT) menggunakan korpus dan sistem terjemahan dinamis. Sistem dapat dilatih dengan menggunakan korpus paralel. Dari hasil pelatihannya, sistem ini dapat mengembangkan seperangkat aturan penerjemahan untuk digunakan dalam proses penerjemahan (Pathak dan Pakray 2019, 445). Google menggunakan teknologi SMT untuk layanan Google Translate selama sekitar 10 tahun, karena pada hari Selasa, 27 September 2016, perusahaan tersebut mengubah teknologi SMT ke sistem Neural MT (NMT). Secara resmi, sistem ini dikenal sebagai sistem Google Neural Machine Translation (GNMT). Secara umum, SMT dan NMT masih memiliki kesamaan. Kedua sistem itu perlu dilatih sebelum melakukan terjemahan. Keduanya juga membutuhkan korpus paralel untuk materi pelatihannya. Faktor-faktor yang membedakan adalah cara kerja teknologi pemrosesan data yang mendasari pada setiap sistem. Dalam proses penerjemahan, setelah melakukan analisis dan membandingkan materi pelatihannya, algoritma SMT menerjemahkan suatu bagian atau keseluruhan teks sumber berdasarkan kemungkinan kemunculannya dalam bahasa target. Hasil terjemahan adalah kata/kalimat yang paling besar kemungkinan kemunculannya. Sistem ini berfungsi baik pada dua bahasa yang memiliki tata kata yang serupa (LingoHub n.d., bagian 2. Statistical Machine Translation (SMT)). Algoritma SMT dibangun dalam kerangka perangkat lunak konvensional umumnya, yaitu suatu sistem perangkat lunak yang bersifat tetap (statis) dan perlu turut campur pihak pemrogramnya jika perlu mendapatkan pembaharuan kualitas penerjemahannya. Sementara itu, sistem NMT menggunakan teknologi neural (saraf), teknologi AI (Artificial Intelligence, Kecerdasan Buatan) yang memungkinkan sistem untuk dilatih secara bottom-up (dari bawah ke atas) seperti melatih individu, karena algoritmanya memiliki kapasitas deep learning, yaitu kemampuan untuk belajar secara
mendalam dan dinamis seperti layaknya otak manusia belajar (Cambridge Dictionary 2020) tanpa terlalu banyak campur tangan seorang programmer. Teknologi AI meniru otak manusia dalam mempelajari pola bahasa dan akhirnya dengan materi pelatihan yang lebih baik, dapat menerjemahkan selayaknya manusia melakukan penerjemahan. Dibandingkan dengan SMT, NMT memiliki tiga keunggulan. Pertama, sistem NMT memahami kesamaan antarkata. Kedua, sistem NMT mempertimbangkan seluruh kalimat dalam proses penerjemahannya. Ketiga, sistem NMT dapat mempelajari hubungan kompleks antarbahasa (Diño 2017). Secara umum, tingkat terjemahan NMT adalah 60% lebih baik daripada SMT (Ernst, Schröter, dan Sudmann 2019, 3). Sistem ini juga mampu mengurangi kesalahan pemesanan kata hingga 50%, mengurangi kesalahan tata bahasa hingga 19%, dan juga mampu mengurangi kesalahan leksikal hingga 17% dibandingkan dengan sistem SMT (Pestov 2018). Christiane Nord menguraikan dua jenis hambatan yang dihadapi para penerjemah, yaitu kesulitan terjemahan dan masalah terjemahan (Nord 1991, 166). Kesulitan terjemahan (translation difficulties) mengacu pada hambatan pribadi terkait dengan kompetensi bahasa penerjemah, pengetahuan khusus, budaya, atau kompetensi terjemahan pribadi mereka lainnya. Berbeda dari kesulitan terjemahan yang bersifat subjektif dan pribadi, masalah terjemahan (translation problems) bersifat objektif dan independen dari hambatan penerjemahan yang terkait pribadi. Masalah terjemahan, terkait dengan teks yang sedang diterjemahkan dan perlu dipecahkan selama proses terjemahan. Nord menguraikan empat masalah terjemahan, yaitu 1) Masalah terjemahan yang bersifat pragmatik (pragmatic translation problems); 2) Masalah terjemahan terkait konvensi (convention-related translation problems); 3) Masalah terjemahan terkait linguistik (linguistic translation problems); 4) Masalah terjemahan khusus terkait teks (text-specific translation problems). Masalah terjemahan pragmatis dapat muncul dari situasi latar belakang dua bahasa (teks sumber dan teks target), di mana keduanya digunakan dan memiliki koneksi dengan tempat, waktu, dan penerima (Schäffner dan Wiesemann 2001, 32). Contoh dari masalah ini adalah referensi tentang waktu dan tempat, istilah yang terikat budaya, dan indikasi hubungan antara pihak yang berkomunikasi
Beberapa penelitian tentang penggunaan NMT Google Translate telah dilakukan. Dalam penelitiannya, Maulida (2017) menemukan persepsi positif siswa terhadap penggunaan Google Translate. Dia menemukan bahwa layanan ini dapat membantu 90% siswa di bawah penelitiannya dalam melakukan tugas sekolah mereka secara lebih cepat, karena proses terjemahannya yang gegas. Penelitian lain juga mengungkapkan bahwa Google Translate memiliki peran dalam membantu akademisi menerjemahkan material teks untuk keperluan akademis mereka (Pujiati 2017). Mirip dengan penelitian ini adalah temuan bahwa Google Translate membantu siswa Paket B sebagai media pembantu selama proses belajar bahasa Inggris (Bayu 2020). Semua studi yang terkait dengan Google Translate menyangkut tentang bagaimana siswa menggunakan Google Translate sebagai alat mereka dalam menerjemahkan dokumen, melakukan tugas kelas, mempelajari bahasa asing, atau tujuan akademis lainnya.
Sejalan dengan Google Translate untuk tujuan awam dan akademik, Google Translate juga merupakan alat praktis untuk penerjemah. Meskipun jarang disentuh secara akademis, ada juga kasus ketika seorang penerjemah menggunakan Google Translate selama terjemahan buku.
Melihat kualitas terjemahan Google Translate, seorang penerjemah buku sering menggunakan layanan tersebut, walaupun tidak menggunakannya secara penuh, karena layanan tersebut masih memiliki beberapa hambatan terjemahan dasar yang harus diperbaiki agar dianggap dapat diterima oleh pembaca teks yang diterjemahkan
Untuk tujuan tersebut, klasifikasi empat masalah terjemahan Christiane Nord diterapkan dalam mendekati dan menganalisis masalah selama proses terjemahan. Sementara itu, teknik terjemahan Molina & Albir diterapkan untuk membantu mengatasi hambatan penerjemahan yang terjadi. Sebagai sumber data penelitian, peneliti menggunakan satu bab buku berisi 5447 kata, yaitu bab 8 buku karya Christine Cottrell, Barista Bible (edisi kedua), yang diterbitkan oleh Coffee Education Network Wilston, Queensland, Australia, 2013. Buku cetak ini adalah buku khusus tentang pembuatan kopi. Barista Bible memiliki 10 bab dan terdiri dari 205 halaman. Buku ini adalah buku panduan dengan teks bahasa Inggris semi formal. Bab 8 sendiri terdiri dari 25 halaman dari semua halaman buku (25% dari semua halaman). Penelitian ini menggunakan metode penelitian kualitatif. Metode kualitatif adalah pendekatan penelitian yang menggunakan data kualitatif (data nonnumerik), seperti dokumen, gambar, atau kata-kata (Johnson dan Christensen 2004). Dalam jenis penelitian ini, para peneliti membangun gambaran yang komprehensif dan kompleks dari kata-kata atau informasi yang diteliti dan mengelolanya semua dalam suasana yang natural (Creswell dalam Herdiansyah 2010, 8).
Dalam hal penelitian ini, data yang akan dianalisis adalah teks buku dan peneliti menggunakan metode tersebut untuk menganalisis versi terjemahannya. Karena teks sumber dalam versi cetak, maka langkah awal adalah mengubah teks menjadi format digital terlebih dahulu. Untuk keperluan itu, aplikasi Android digunakan, perangkat lunak Text Fairy (OCR Text Scanner).
Dipadu dengan kamera ponsel, aplikasi ini memindai teks yang tersedia dan mengubahnya menjadi format digital yang dapat dimodifikasi. Data ini kemudian disimpan dalam format Word sebagai teks sumber. Teks sumber tersebut kemudian dimasukkan ke Google Translate bagian demi bagian, tidak lebih dari 3000 karakter per terjemahan. Langkah ini memungkinkan proses analisis diselesaikan per bagian yang memudahkan langkah koreksi dan edit secara manual. Hasil koreksi dan edit kemudian dipisahkan dan difungsikan sebagai teks kontrol.