Thứ Tư, 31 tháng 3, 2021

Dịch tự động kanji sang tiếng Việt

Chào các bạn!

Nếu biết ý nghĩa của từng chữ kanji một, thì liệu chúng ta có thể dịch tự động một từ tiếng Nhật ra tiếng Việt không?

Ví dụ, chữ 平和 (bình hòa) thì có nghĩa là "hòa bình", tức là ngược với tiếng Việt. Nhưng nếu chúng ta biết âm đọc Hán Việt thì có lẽ cũng suy luận được.

Như thế, nếu đưa cho chúng ta một từ tiếng Nhật thì chúng ta sẽ đọc theo âm Hán Việt, rồi đảo ngược, để xem có gợi ý gì không.

Hoặc là từ 学力 chẳng hạn. Nếu 学 = học, 力 = lực, sức thì chúng ta có các từ: học lực, lực học, sức học.

Hoặc 幸運 (hạnh vận) chẳng hạn, nếu 運 = vận, số; 幸 = may, hên, đỏ, thì ta có: vận may, vận hên, vận đỏ, số may, số hên, số đỏ.

Như thế thì nếu chúng ta dịch hết được nghĩa của các chữ kanji đơn lẻ thì có lẽ khi tra từ ghép nhiều kanji, chúng ta có thể dịch tự động ra tiếng Việt một phần nào cho đỡ vất vả.

Ít ra thì vẫn tốt hơn là dịch theo kiểu từ điển Hán Tôm 学力= học lực, 幸運 = hạnh vận, đúng không nhỉ?

Để làm được điều này thì chúng ta phải tạo một cơ sở dữ liệu các nghĩa của chữ kanji riêng lẻ, sau đó ghép các nghĩa này với nhau và thử xem từ đó có phải là một từ tiếng Việt chuẩn không.

Từ điển Yurica có thể dịch tự động từ ghép kanji sang tiếng Việt.

Hiện nay tại từ điển Yurica ngoài từ điển Hán Tôm đã có Dịch tự động Kanji sang tiếng Việt. Cơ sở dữ liệu (database) và thuật toán (algorithm) sẽ được nâng cấp thường xuyên để cung cấp các bản dịch chính xác hơn theo thời gian.

Takahashi

Không có nhận xét nào:

Đăng nhận xét