Thứ Bảy, 12 tháng 1, 2019

Cách bỏ dấu tiếng Việt kiểu cũ và kiểu mới

Cách bỏ dấu tiếng Việt kiểu cũ:
òa, óa, ỏa, õa, ọa
òe, óe, ỏe, õe, ọe
ùy, úy, ủy, ũy, ụy

Cách bỏ dấu kiểu mới:
oà, oá, oả, oã, oạ
oè, oé, oẻ, oẽ, oẹ
uỳ, uý, uỷ, uỹ, uỵ

Tuy nhiên, các vần mà có 3 nguyên âm hoặc có phụ âm cuối sẽ như nhau. Ví dụ:
oèo, uỷu, oáy, oái
oàn, uýt, oẹt, oạm

Xem: Quy tắc đặt dấu thanh trong chữ quốc ngữ

Tôi ủng hộ bỏ dấu kiểu cũ vì nhìn đẹp hơn. Hiện nay bộ gõ của Google cho Android thì áp dụng cả hai kiểu ví dụ "hoá" nhưng lại "túy".

Nếu chỉ đọc thì ai cũng hiểu nhưng khi dùng chương trình máy tính để xử lý thì ví trí bỏ dấu thanh (thanh điệu tiếng Việt) có thể sẽ gây ra rắc rối. Do đó, phải viết hàm số chuyển đổi thành tiếng Việt chuẩn trước khi thực hiện thao tác xử lý nào.

Nếu muốn tạo ra một chương trình thông minh thì phải rà soát được lỗi chính tả từ đó phán đoán ra chữ đúng.

Tôi sẽ viết ra hàm số chuyển đổi mọi thứ thành tiếng Việt chuẩn, tự phán đoán được lỗi. Tuy chưa phải là machine learning nhưng cũng có thể tương đối chính xác.

Ví dụ: túyêt => tuyết, tuyetj => tuyệt, phuwowgn => phương, veeitj => việt chẳng hạn.

Ngoài ra còn vấn đề "y" và "i": Khi nào dùng "y" và khi nào dùng "i" ví dụ "kỳ" hay "kì".

Vấn đề dùng y dài hay i ngắn thì có lẽ cũng tùy theo thẩm mỹ, thói quen sử dụng vv của mỗi người nhưng khi xử lý ngôn ngữ thì vẫn phải thống nhất mới có thể xử lý được.

1 nhận xét: