Studi Ungkap Negara dengan Pengguna Kata Kasar Terbanyak di Dunia Maya: Amerika Serikat Teratas

Sebuah studi linguistik yang komprehensif baru-baru ini mengungkap pola penggunaan kata-kata kasar di berbagai negara berbahasa Inggris dalam ranah digital. Penelitian ini, dipimpin oleh seorang ahli bahasa dari Australia, menganalisis data yang luas dari Global Web-Based English Corpus (GloWbE) untuk mengidentifikasi negara-negara dengan warga yang paling sering menggunakan kata-kata umpatan secara daring.

Hasil penelitian menunjukkan bahwa Amerika Serikat menduduki peringkat pertama sebagai negara dengan pengguna kata kasar terbanyak di dunia maya, mengungguli negara-negara lain seperti Inggris dan Australia. Studi ini melibatkan analisis terhadap 1,9 miliar kata dari 1,8 juta halaman web yang tersebar di 340.000 situs web di 20 negara berbahasa Inggris. Temuan ini memberikan wawasan menarik tentang bagaimana vulgaritas diekspresikan dalam komunikasi tertulis.

Peneliti mengamati sebanyak 597 kata-kata vulgar, termasuk variasi ejaan dan konsep atau frasa serupa. Penelitian ini menyoroti kompleksitas vulgaritas sebagai fenomena linguistik yang memiliki banyak dimensi. Sementara Australia dikenal memiliki budaya santai dan terbuka, penelitian ini menemukan bahwa Australia berada di bawah Amerika Serikat dan Inggris dalam penggunaan bahasa vulgar secara daring. Salah satu teori yang diajukan adalah bahwa warga Australia mungkin lebih konservatif dalam ekspresi verbal mereka di platform digital dibandingkan dalam interaksi tatap muka.

Berikut adalah daftar 10 negara dengan persentase warga yang paling banyak menggunakan kata-kata kasar berdasarkan data dari jurnal Lingua:

  • Amerika Serikat: 0,036%
  • Inggris: 0,025%
  • Australia: 0,022%
  • Singapura: 0,021%
  • Selandia Baru: 0,02%
  • Malaysia: 0,019 %
  • Irlandia: 0,019%
  • Jamaica: 0,017%
  • Kanada: 0,017%
  • Nigeria: 0,016%

Dalam menganalisis data, para peneliti berfokus pada bentuk dan frekuensi kata-kata yang dianggap vulgar tanpa mempertimbangkan aspek fungsionalnya. Pengolahan data dilakukan dengan menggunakan perangkat lunak RStudio, di mana data teks dari GloWbE dimuat dan dipecah menjadi teks individual. Teks-teks ini kemudian diubah menjadi perangkat data dengan kolom yang mencakup wilayah, nama berkas, pengenal teks, jenis wacana, dan teks mentah. Teks mentah kemudian dibersihkan dengan mengubah teks menjadi huruf kecil dan menghapus elemen non-kata seperti emoji dan tanda baca. Daftar ekspresi reguler yang berasal dari penelitian sebelumnya digunakan untuk mendeteksi variasi ejaan, serta bentuk awalan, akhiran, dan gabungan dari kata-kata vulgar.