Ưu và nhược điểm của ngôn ngữ học tính toán

9

Ngôn ngữ học tính toán, không còn nghi ngờ gì nữa, là một trong những ngành thách thức nhất trong lĩnh vực CNTT. Trong khi các ngành khác hoạt động dựa trên các nguyên tắc rất chính xác, ngôn ngữ học tính toán cố gắng tái tạo hoặc mô hình hóa các ngôn ngữ giao tiếp tự nhiên. Ngôn ngữ học tính toán hướng đi khá ấn tượng, vì các giải pháp này xử lý các công cụ nhận dạng giọng nói, dịch vụ dịch thuật, giải pháp ngữ pháp và chính tả. Mặc dù mỗi cái đều là một thách thức thực sự, một số cải tiến gần đây trong lĩnh vực này dường như tích hợp nhiều hơn một tùy chọn, để đa dạng hóa tiện ích của ứng dụng và phục vụ yêu cầu của khách hàng tốt hơn. chúng ta nên vạch ra ngay từ đầu rằng các lĩnh vực ngữ nghĩa và ngữ pháp chắc chắn là ưu tiên hàng đầu của tất cả các nhà ngôn ngữ học máy tính.

Những nỗ lực của họ được hình thành theo nhiều cách, tuy nhiên, có vẻ như nhiều trong số chúng không khả thi 100%, nghĩa là chúng chạy nhưng không báo hiệu được một số loại lỗi nhất định. Chẳng hạn, ứng dụng phần mềm kiểm tra ngữ pháp thường không thể xác định các lỗi phổ biến. Nhiều người không thể giải thích tại sao, vì quy tắc ngữ pháp đó thường được dạy ở trường tiểu học và một phần mềm tiên tiến không thể nhận ra nó. Mấu chốt nằm ở chỗ, một phần mềm không thể suy nghĩ, nó xử lý thông tin theo một cách hoàn toàn khác, luôn hoạt động theo một khuôn mẫu được thiết lập sẵn. Nói cách khác, công cụ này hoạt động khi nhận ra đúng ngữ pháp và lỗi sai. Nếu không có điều nào trong số này xảy ra, phần mềm kiểm tra ngữ pháp của bạn rất có khả năng coi một lỗi ngữ pháp là hoàn toàn chính xác.

Mặc dù kiểm tra chính tả trực tuyến là một trong những nỗ lực đầu tiên trong ngôn ngữ học máy tính, cách các chuyên gia CNTT xử lý ngôn ngữ tự nhiên thậm chí còn tiến xa hơn và bằng chứng tốt nhất theo nghĩa này là các công cụ dịch thuật đã được tối ưu hóa để lưu trữ các mẫu nhất định từ cả hai ngôn ngữ, chính xác hơn là cách người dùng dịch một số từ, thuật ngữ và cụm từ nhất định. Và khi phần mềm xác định các từ hoặc cấu trúc giống nhau, nó có thể tự động dịch văn bản mới sang cấu trúc từ vựng hoặc ngữ pháp đã được xử lý sẵn. Ngữ nghĩa là một nhánh khác đã kết hợp khá tốt với khoa học máy tính. Ở chương này, ưu đãi rất đa dạng vì phân khúc này phụ thuộc nhiều hơn vào cơ sở dữ liệu. Những công cụ này có thể cung cấp các từ đồng nghĩa, từ trái nghĩa và bất kỳ thứ gì có thể tạo ra nghĩa tương tự nhưng với các từ khác hoặc nghĩa mới đối lập với một thuật ngữ nhất định. Các ứng dụng mới nhất thậm chí có thể tạo ra các vần vì ngôn ngữ học tính toán có thể xác định các từ có cùng cấu trúc ngữ âm.


Khôi Nguyên