Logo of Vovisoft

 

Kỹ niệm một năm áp dụng Unicode Việt ngữ cho web site Vovisoft

Ngày 22 tháng 12 năm 2000

Chúc Mừng Vovisoft đă áp dụng Unicode cho chữ Việt trên toàn mạng web vừa tṛn một năm tuổi !!! 
Website Vovisoft đă hoàn tất chuyển mă từ VPS qua Unicode trong ngày 22 tháng 12 năm 1999
qua chương tŕnh Viet to Unicode converter được viết bằng Visual Basic 5 của tiến sĩ Lê Đức Hồng.
Đánh dấu một ngày lịch sử lần đầu tiên tiếng Việt Unicode được dùng trong một web site 
Việt ngữ trên Internet theo kịp đà tiến triễn của các ngôn ngữ khác trên thế giới mà Unicode hỗ trợ !

Phần trên đă được trịnh trọng ghi vào phần đầu trang của web site Vovisoft. Có lẻ có nhiều người thắc mắc tại sao lại đặt nặng vấn đề này có phải bây giờ đă có nhiều web sites cũng sử dụng Unicode cho chữ Việt trên Internet đó sao?

Nếu bạn nằm trong ban quản trị của Vovisoft và trải qua quá tŕnh tiến đến việc sử dụng Unicode cho cả web site Vovisoft th́ bạn sẽ không c̣n ngạc nhiên tại sao chúng tôi lại tự hào và hân hoan với thành quả mà chúng tôi đă đạt được trong việc sử dụng Unicode cho chữ Việt. Để bắt đầu thiết tưởng chúng ta cũng nên chạy ngược ḍng một tí để nói về xuất sứ của Unicode tại Vovisoft.

Vào đầu năm 1999, sau khi đă hoàn tất web site Vovisoft bằng tiếng Việt, chúng tôi cảm thấy sự bất tiện của font chữ Vps được dùng trong mạng web Vovisoft để tŕnh bày chữ Việt. V́ rằng nếu dùng font nào th́ người đọc trên mạng đều cần phải có font đó cài đặt sẵn trong máy th́ mới có thể đọc được chữ Việt. Do đó những người không sử dụng Vps sẽ không buồn cài đặt Vps để đọc các trang của Vovisoft. Chúng tôi đă chia nhau t́m lục qua Internet để xem có giải pháp nào hay hơn là phải dùng một trong các font chữ Việt có sẵn trong thị trường như Viscii, Vps, Vni, VietKey vv... 

Chúng tôi đi qua các trang nói về Unicode nhưng không thấy nói ǵ đến chữ Việt và chúng tôi đă bỏ đi. Rồi chúng tôi viếng đến web site khổng lồ của Micorsoft và duyệt qua embedded fonts nhưng cũng không hài ḷng v́ 2 điểm sau: thứ nhất tạo loại font này rườm rà, thứ hai font này không đẹp mắt v́ nó nḥa, nét chữ không đều và browsers phải download từng cụm font xuống máy rồi mới đọc được. Lợi điểm của loại embedded fonts là không lệ thuộc vào fonts nào cả và nó được xem như một dạng font  file. Nếu vậy th́ có lẻ người ta sài thẳng gif file th́ vừa đẹp hơn mà lại tiện gọn hơn. Bất lợi chung của embedded font và gif image file là:

1. nặng nề không đẹp mắt
2. không t́m tra được v́ không phải là text (image files)
3. khó xử lư và sửa đổi
4. Phải download v́ không có sẵn trong máy

Cuối cùng th́ có hai thầy trong Vovisoft đă gần như đi đến kết luận sử dụng embedded font v́ dù sao nó cũng có ưu điểm hơn các loại font khác được dùng cho web. Nếu không phải có một việc khác xẩy ra th́ có lẻ ngày hôm nay font chữ mà các bạn nh́n thấy trong trang web của Vovisoft sẽ là embedded font chứ không phải là Unicode. Muốn biết thêm về embedded fonts mời bạn search trang Microsoft WEFT (Web Embedding Fonts Tool for MSIE).

Vào cuối tháng 10 năm 1999, Webmaster tôi t́nh cờ thăm viếng một website bên Mỹ rao rằng họ có các ngôn ngữ khác nhau trong web site cho khách hàng. Nhưng khi lục lạo vào th́ chỉ thấy có vài ngôn ngữ Á Châu cho nên tôi mới gơ  vào mục contact và hỏi họ có thể thêm hỗ trợ cho chữ Việt không. Không ngờ vài ngày sau, ngày 2 tháng 11 năm 1999, họ trả lời nghiêm túc rằng họ sẽ hỗ trợ tiếng Việt và đang t́m phiên dịch viên Việt ngữ. Khi tôi hé cho họ biết tôi làm trong ngành dịch thuật th́ họ đề nghị tôi dịch một số trang web của họ qua tiếng Việt. Nhưng khi tôi đề nghị họ dùng VPS cho font chữ Việt th́ họ nói họ chỉ muốn Unicode chữ Việt trong trang web v́ tất cả các trang web về đa ngôn ngữ của họ đều dùng Unicode.

Trước giờ tôi chỉ biết Unicode đươc sử dụng trong một số ngôn ngữ trên thế giới như tiếng Hoa, Nhật, Đại Hàn, Thái vân vân... nhưng có thấy trang Việt ngữ nào sử dụng Unicode đâu? Tôi bèn lục qua các trang web của những cơ quan, công ty Việt Nam chuyên về Input tiếng Việt như Vps, Viscii, Vni, Vietkey vân vân... nhưng tuyệt nhiên không thấy trang nào nhắc đến Unicode và cách sử dụng nó trong tiếng Việt. Tôi vẫn chưa năn ḷng bèn vào các search Engine như Yahoo, Excite, Altavista, Lycos vân vân, gơ vào đủ thứ từ để lục cho ra manh mối có liên quan đến Unicode chữ Việt nhưng cũng không thấy có trang nào nói về Unicode cho chữ Việt.

Cuối cùng th́ tôi cũng lục ra được vài bản chuyển mă từ Vps qua Unicode trong Mozilla project của Netscape. Nhưng không thấy nói ǵ thêm về cách dùng...! 

...

Rất tiếc là đến ngày 20-11-1999 th́ chương tŕnh dịch từ Anh qua Việt của công ty đó phải ngưng lại v́ không t́m ra giải pháp Unicode cho chữ Việt trên mạng web. Chấm dứt sự lục t́m cật lực trong suốt 2 tuần hơn của tôi và người quản lư bên kia về cách dùng Unicode cho chữ Việt trên trang web. Mặc dù không thành nhưng tôi đă có khá nhiều dữ liệu và ḷng tin về Unicode sử dụng cho tiếng Việt. Trang web của Microsoft lúc đó (công ty tiên tiến nhất về các hỗ trợ cho các ngôn ngữ trên thế giới bằng Unicode) đă nhắc đến Unicode dùng cho chữ Thái, chữ Cambốt, chữ Lào nhưng tuyệt nhiên không nói ǵ đến Unicode cho chữ Việt. Là người Việt Nam th́ hỏi bạn có thấy tức không? Riêng tôi thấy rất ức lúc ấy. 

Vào ngày 9-11-1999 tôi gửi một bức điện thư cho thầy Hồng với nội dung như sau:
Tôi đang t́m font chữ Unicode cho tiếng Việt. thầy có bao giờ thấy font Unicode chữ Việt không? Tôi nghĩ rằng font Việt Nam dựng sẵn trong windows 98 và IE5 là Unicode. Nó không dung ḥa với bất kỳ một font Việt nào như Vps, Viscii, Vni vân vân mà chúng ta biết đến. Tôi đă thử dùng font có sẵn trong Win98 để đọc các trang có chữ Việt nói trên nhưng không đọc được. Nếu thầy biết ở đâu có thể lấy được font chữ Unicode Việt Nam xin cho tôi biết.

Ngày 10-11-1999 tôi nhận được thư trả lời của thầy Hồng như sau:
Khoan đă tốn công với Unicode. Trong Microsoft chưa có thứ đó đâu. Có lẻ họ đă bỏ rơi Việt Nam v́ họ không thể bán software nào tại Việt Nam. Nguyên văn như sau: "Don't bother with Unicode yet. There's no such thing yet within Microsoft. Probably, they have abandoned Vietnam because they could not make any software sales in VN."

May thay rồi cũng thuyết phục được các thầy nghiên cứu sâu vào Unicode và chúng tôi đă đi đến kết luận chỉ có Unicode là giải quyết được tất cả các khó khăn của các môn phái vơ lâm sử dụng Việt ngữ trên mạng web...

... thế rồi thầy Hồng , thầy Tín và tôi chia nhau ra t́m các mănh vụn về Unicode chữ Việt trên mạng Web khắp thế giới, trên sách vỡ và dần dần chúng tôi đă thấy ánh sáng ...

Đê
m 22-12-1999 thầy Hồng gửi email cho Đại sư huynh, thầy Giác, thầy Hiếu, thầy Tín và tôi thông báo:
"Tôi đă chuyển web site Vovisoft qua Unicode trong đêm nay" nguyên văn như sau:
"I've changed our Vovisoft Website to Unicode tonight."

Trong hai ngày đầu, website Vovisoft có người đọc được và có người không đọc được chữ Việt mà chỉ thấy toàn là ô vuông. Thầy Hồng đă dùng font Arial cho các font chữ v́ máy thầy dùng NT 4 nên đọc được nhưng những anh em sử dụng Windows 98 th́ đa số đều không đọc được. 

Theo sự t́m ṭi của chúng tôi th́ lúc đó chỉ có vài font như Arial, Tahoma và Verdana là có glyphs chữ Việt nhưng nếu những font trên có kích cỡ dưới 170 kb hay có time stamp trước tháng 6 năm 1998 th́ lại không có glyphs chữ Việt. Qua thử nghiệm trên một số máy có hệ điều hành khác nhau từ Windows 95.x đến Windows 98.x, chúng tôi đi đến kết luận là font Tahoma có xác suất chứa glyphs chữ Việt cao nhất. Vào ngày 24-12-1999 thầy Hồng báo cho tôi biết: "I'll try changing Arial to Tahoma today". Ngay sau đó 90% anh em báo lại cho biết đều đọc được chữ Việt Unicode trên mạng Vovisoft.

Cho đến nay th́ rất mừng là chúng tôi đă chọn đúng hướng và đi đúng đường. Lần lượt đă có nhiều website khắp nơi trên thế giới đă chuyển sang Unicode. Có người th́ c̣n sử dụng font cũ và chuyển dần dần, có người mạnh dạn chuyển hẵn qua Unicode và có người bắt đầu ngay bằng Unicode. Chúng tôi hy vọng những ai đọc được trang này cũng sẽ chuyển qua sử dụng Unicode. 

Một hôm, khi sử dụng một máy trong một tiệm cà phê Internet (Internet cafe) tại Sydney (máy chạy Windows 98, không có lấy một font hay phần mềm nào về tiếng Việt), tôi thấy thích thú vô cùng khi gơ vào địa chỉ mạng Vovisoft (www.vovisoft.com) trong IE 5, tức th́ tôi đọc được tất cả các chữ Việt trong trang web của Vovisoft. Không cần đặt setting, không cần đổi font, không cần làm ǵ cả ... Bạn cũng có thể thử nghiệm xem tôi nói có đúng không.

C̣n tiếp...


Cách đọc Unicode chữ Việt trên mạng Web Vovisoft

Vovisoft dùng Unicode cho chữ Việt trên mạng Web. Ðể đọc được chữ Việt trên mạng Vovisoft bạn không cần phải download một font chữ Việt Nam nào cả. Font chữ Vovisoft dùng trên Web là "Tahoma", một Unicode font có sẵn trong Windows98  hay hệ thống máy tính nào đã cài đặt Internet Explorer 5.0. Nếu cần bạn chỉ cần sửa lại settings của browser như sau:

  Internet Explorer 5.x: View | Encoding | chọn  Western European và Auto Select
                            hay: View | Encoding | chọn  Unicode UTF-8 và Auto Select

  Netscape 4.x: Chỉ có diễn đàn Vovisoft hỗ trợ Browser này. Xin cáo lỗi!

  Netscape 6.x:  Browser mới này đă đọc được Unicode NCR của Vovisoft

Những bạn c̣n sử dụng Windows 95.x và IE 4.x th́ chỉ cần download font "Tahoma" mới là đọc được Unicode trong các trang của Vovisoft. 


Các ứng dụng Unicode trong web site Việt Ngữ

Bản đối chiếu mă của nguyên âm các bộ chữ Việt Nam hiện hành với Unicode

T́m hiểu font nào trong máy bạn hiển thị được Unicode chữ Việt

Dùng VB6 để hoán chuyển Unicode (có source code kèm theo)

Chuyển toàn bộ Web site VPS, VSCII, VNI vv... của bạn thành Unicode

Cách dùng Frontpage 98/ 2000 để viết webpage Việt ngữ

Cách dùng Unicode chữ Việt trong Ms Word và Ms Office 97/ 2000

Cách dùng Outlook Express 5 để gửi và nhận Email Unicode Việt Ngữ

Cách dùng Outlook 2000 để gửi và nhận Email Unicode Việt Ngữ

Cách dùng Hotmail để gửi và nhận Email Unicode Việt Ngữ

Cách dùng Yahoo Mail để gửi và nhận Email Unicode Việt Ngữ

Giới thiệu về quá tŕnh sử dụng Unicode cho chữ Việt trên mạng web Vovisoft


Các ứng Dụng Unicode trong Visual Basic 6
(Dành cho thảo tŕnh viên chuyên nghiệp)

Tất cả bài viết đều có kèm theo VB6 Source Code và Free Download!

Dùng VB6 để hoán chuyển Unicode(mới) 

Một Editor đơn giản cho Unicode(mới) 

Dùng Unicode cho Access 2000(mới)

Căn bản Unicode cho VB6 programers (mới)

13 hàm cho tiếng Việt, kể cả UTF-8 encoding  (mới)

C̣n tiếp... mời bạn trở lại ...

 

Trở về trang chính Unicode