Tiêu chuẩn TCVN 6909:2001 – “Công nghệ thông tin - Bộ mã ký tự Tiếng Việt 16-bít” 

Tiêu chuẩn TCVN 6909:2001 - “Công nghệ thông tin - Bộ mã ký tự Tiếng Việt 16-bít” là tiêu chuẩn quy định bộ mã 16-bít, quy định cấu trúc của bộ mã ký tự tiếng Việt 16-bít thông qua việc mô tả các tập ký tự thành phần và quy ước mã hóa từng ký tự trong bảng mã, nhằm phục vụ việc biểu diễn, lưu trữ và trao đổi các ký tự tiếng Việt trong công nghệ thông tin. Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các ký tự tiếng Việt, kỹ thuật hiển thị và xử lý những ký tự này.

T

CVN 6909:2001 do Tiểu ban kỹ thuật Tiêu chuẩn TCVN/JTC1/SC2 Công nghệ Thông tin – Các ký tự và mã hóa thông tin biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ ban hành năm 2001. Hiện tại, tiêu chuẩn TCVN 6909:2001 - “Công nghệ thông tin - Bộ mã ký tự Tiếng Việt 16-bít” đã được thống nhất sử dụng trong trao đổi thông tin điện tử giữa các tổ chức của Đảng và Nhà nước theo Quyết định 72/2002/QĐ-TTG ngày 10 tháng 6 năm 2002 của Thủ tướng Chính phủ về việc “Thống nhất dùng bộ mã các ký tự chữ Việt theo Tiêu chuẩn TCVN 6909:2001 trong trao đổi thông tin điện tử giữa các tổ chức của Đảng và Nhà nước“ kể từ ngày 01 tháng 01 năm 2003. Theo đó, Bộ Khoa học và Công nghệ cũng đã ban hành Thông tư số07/2002/TT-BKHCN ngày 15 tháng 11 năm 2002 về việc “Hướng dẫn triển khai Quyết định số 72/2002/QĐ-TTG của Thủ tướng Chính phủ về việc thống nhất dùng Bộ mã các ký tự chữ Việt theo tiêu chuẩn TCVN 6909:2001 trong trao đổi thông tin điện tử giữa các tổ chức của Đảng và Nhà nước”.

Tiêu chuẩn TCVN 6909:2001 ra đời nhằm giải quyết các vấn đề về sự thiếu thống nhất trong biểu diễn, lưu trữ và trao đổi ký tự tiếng Việt trong lĩnh vực công nghệ thông tin nói chung. TCVN 6909:2001 được bắt buộc áp dụng trong các ứng dụng tin học hoá Văn phòng; các trao đổi thông tin chữ Việt trên các mạng máy tính, kể cả mạng Internet, Intranet của các cơ quan Đảng và Nhà nước; các giao dịch, dịch vụ sử dụng thông tin điện tử của các cơ quan Đảng và Nhà nước với nhân dân có sử dụng máy tính một cách trực tuyến hoặc không trực tuyến; các trang thông tin điện tử chữ Việt.

Thêm vào đó, sau khi TCVN 6909:2001 ra đời thì việc chuyển đổi các hồ sơ lưu trữ điện tử và các cơ sở dữ liệu đã lưu trữ theo các bộ mã khác với Bộ mã TCVN 6909:2001 của các cơ quan Đảng và Nhà nước sẽ được thực hiện từng bước sang Bộ mã TCVN 6909:2001 tuỳ theo tính cấp bách, quy mô và phạm vi phục vụ, nhu cầu của từng cơ quan, tổ chức. Phần lớn các hồ sơ lưu trữ điện tử không cần chuyển ngay sang Bộ mã TCVN 6909:2001 mà sẽ sử dụng các công cụ chuyển đổi khi có nhu cầu tra cứu.

Để đảm bảo việc trao đổi thông tin văn bản điện tử một cách thống nhất trong các cơ quan của Đảng và Nhà nước, dạng biểu diễn quy định dùng để trao đổi thông tin văn bản điện tử là dạng biểu diễn ký tự dựng sẵn. Đối với dạng biểu diễn ký tự khác dạng ký tự dựng dẵn trong bộ mã TCVN 6909:2001 của các cơ sở dữ liệu. Khi trao đổi dưới dạng văn bản điện tử giữa các cơ quan Đảng và Nhà nước đều phải chuyển đổi sang dạng ký tự dựng sẵn trong Bộ mã TCVN 6909:2001.

Tiêu chuẩn TCVN 6909:2001 hoàn toàn phù hợp với tiêu chuẩn quốc tế ISO/IEC 10646-1:2000 (Bộ ký tự tổng hợp mã hóa bằng nhiều octet, phần 1: Kiến trúc và mặt phẳng đa ngôn ngữ cơ bản) và Unicode 3.0.

Đặc điểm kỹ thuật

Một số thuật ngữ

Ký tự

Ký tự là một thành viên của một tập chứa các phần tử được dùng để biểu diễn, tổ chức hoặc điều khiển dữ liệu.

Bít

Bít là chữ số 0 hoặc 1 dùng trong hệ đếm nhị phân

Byte

Byte là một chuỗi bao gồm một số bít được xử lý như một đơn vị và thường biểu diễn cho một ký tự hoặc một bộ phận của ký tự

Octet

Octet là một byte chứa 8 bít

Ký tự khả hiện

Ký tự khả hiện là ký tự có hình dáng đồ họa ở dạng viết tay, dạng in hoặc hiển thị và không có chức năng điều khiển.

Mã ký tự

Mã ký tự là giá trị số của một chuỗi các bít sắp xếp có thứ tự trong biểu diễn một ký tự mã hóa.

Tập ký tự mã hóa

Tập ký tự mã hóa là tập hợp những ký tự tuân theo các quy tắc thiết lập cấu trúc và quan hệ giữa từng ký tự trong đó với mã ký tự tương ứng.

Bộ mã ký tự

Bộ mã ký tự là một hoặc một số tập ký tự mã hóa được xác định rõ ràng về thành phần cấu trúc và bảng mã của chúng.

Bảng mã

Bảng mã là bảng trình bày các ký tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.

Ký tự dấu thanh

Ký tự dấu thanh là thành phần của nhóm ký tự dấu thanh điệu, có khả năng tổ hợp với một số ký tự nguyên âm thành những ký tự có thanh điệu khác.

Ký tự dấu nguyên âm

Ký tự dấu nguyên âm là thành phần của nhóm ký tự dấu nguyên âm, có khả năng tốt hợp với một số ký tự nguyên âm thành những ký tự nguyên âm khác.

Các tập ký tự của TCVN 6909:2001

Các tập ký tự của TCVN 6909:2001 bao gồm: tập ký tự cơ bản và tập ký tự mở rộng.

Tập ký tự cơ bản

Tập ký tự cơ bản gồm 119 ký tự khả hiện nằm trong sáu nhóm, bao gồm: nhóm chữ cái, nhóm dấu thanh, nhóm dấu nguyên âm, nhóm chữ số, nhóm ký hiệu và nhóm dấu câu.

Nhóm chữ cái bao gồm 33 chữ cái, biểu diễn 12 nguyên âm và 21 phụ âm cơ bản. Trong đó, mỗi chữ cái có hai dạng là chữ in hoa và chữ thường. Cụ thể như bảng dưới đây:

Chữ in hoa

A

Ă

Â

E

Ê

I

0041

0102

00C2

0045

00CA

0049

Chữ in hoa

O

Ô

Ơ

U

Ư

Y

004F

00D4

01A0

0055

01AF

0059

 

Bảng nhóm các nguyên âm chữ in hoa

 

Chữ thường

a

ă

â

e

ê

i

0061

0103

00E2

0065

00EA

0069

Chữ thường

o

ô

ơ

u

ư

y

006F

00F4

01A1

0075

01B0

0079

 

Bảng nhóm các nguyên âm chữ thường

 

Chữ in hoa

B

C

D

Đ

F

G

H

0042

0043

0044

0110

0046

0047

0048

Chữ in hoa

J

K

L

M

N

P

Q

004A

004B

004C

004D

004E

0050

0051

Chữ in hoa

R

S

T

V

W

X

Z

0052

0053

0054

0056

0057

0058

005A

 

Bảng nhóm các phụ âm chữ in hoa

 

Chữ thường

b

c

d

đ

f

g

h

0062

0063

0064

0111

0066

0067

0068

Chữ thường

j

k

l

m

n

p

q

006A

006B

006C

006D

006E

0070

0071

Chữ thường

r

s

t

v

w

x

z

0072

0073

0074

0076

0077

0078

007A

Bảng nhóm các phụ âm chữ thường

 

Nhóm dấu thanh bao gồm 5 ký tự, cụ thể gồm: dấu huyền (`); dấu hỏi (ʼ); dấu ngã (~); dấu sắc (´); dấu nặng (.).

Dấu thanh

`

ʼ

~

´

.

Mô tả

Dấu huyền

Dấu hỏi

Dấu ngã

Dấu sắc

Dấu nặng

0300

0309

0303

0301

0323

 

Bảng nhóm các dấu thanh

            Nhóm dấu nguyên âm bao gồm 3 ký tự:  ̌  (ví dụ trong chữ "ă");  ̂ (ví dụ trong chữ “â“); ̓ (ví dụ trong chữ "ư").

Dấu nguyên âm

̌

̂

 ̓

Mô tả

Dấu võng

Dấu nón

Dấu móc

0306

0302

031B

 

Bảng nhóm các dấu nguyên âm

 

            Nhóm các chữ số bao gồm 10 ký tự: 0; 1; 2; 3; 4; 5; 6; 7; 8; 9.

Chữ số

0

1

2

3

4

5

6

7

8

9

0030

0031

0032

0033

0034

0035

0036

0037

0038

0039

 

Bảng nhóm các chữ số

            Nhóm các ký hiệu bao gồm 20 ký tự: “; #; $; %; &; ‘; *; +; -; /; <; =; >; @; \; ^; _; |; `; ~.

Ký hiệu

#

$

%

&

*

+

-

/

Mô tả

Dấu ngoặc kép

Dấu thăng

Dấu đô la

Dấu phần trăm

Dấu và

Dấu ngoặc đơn

Dấu hoa thị

Dấu cộng

Dấu trừ

Dấu chia

0022

0023

0024

0025

0026

0027

0028

0029

002D

002F

Ký hiệu

=

@

\

^

_

|

`

~

Mô tả

Dấu nhỏ hơn

Dấu bằng

Dấu lớn hơn

Dấu a còng

Dấu sổ ngược

Dấu mũ

Dấu gạch dưới

Dấu sổ

Dấu trầm

Dấu sóng

003C

003D

003E

0040

005C

005E

005F

007C

0060

007E

 

Bảng nhóm các ký hiệu

            Nhóm các dấu câu bao gồm có 15 ký tự: !; (; ); ,; .; :; ;; ?; [; ]; {; }; “; „.

Dấu câu

!

(

)

,

.

:

;

?

Mô tả

Dấu chấm than

Dấu ngoặc đơn mở

Dấu ngoặc đơn đóng

Dấu phẩy

Dấu chấm

Dấu hai chấm

Dấu chấm phẩy

Dấu hỏi chấm

0021

0028

0029

002C

002E

003A

003B

003F

Dấu câu

[

]

{

}

SP

 

Mô tả

Dấu ngoặc vuông mở

Dấu ngoặc vuông đóng

Dấu ngoặc nhọn mở

Dấu ngoặc nhọn đóng

Dấu mở ngoặc kép

Dấu đóng ngoặc kém

Dấu cách

 

005B

005D

007B

007D

201C

201D

0020

 

 

Bảng nhóm các dấu câu

            Tập ký tự mở rộng

            Ngoài tập ký tự cơ bản, TCVN 6909:2001 còn quy định tập ký tự mở rộng bao gồm có 60 ký tự chữ in hoa và 60 ký tự chữ thường của các nguyên âm mang dấu thanh. Cụ thể trong bảng dưới đây

Chữ in hoa

À

Ã

Á

Chữ thường

à

ã

á

Chữ in hoa

È

É

Ì

Ĩ

Í

Chữ thường

è

é

ế

ì

ĩ

í

Chữ in hoa

Ò

Õ

Ó

Chữ thường

ò

õ

ó

Chữ in hoa

Ù

Ũ

Ú

Ý

Chữ thường

ù

ũ

ú

ý

 

Bảng các ký tự mở rộng

Ứng dụng

TCVN 6909:2001 - “Công nghệ thông tin - Bộ mã ký tự Tiếng Việt 16-bít” đã được thống nhất sử dụng trong trao đổi thông tin điện tử giữa các tổ chức của Đảng và Nhà nước theo Quyết định 72/2002/QĐ-TTG ngày 10 tháng 6 năm 2002 của Thủ tướng Chính phủ kể từ ngày 01 tháng 01 năm 2003. Trong Thông tư số 22/2013/TT-BTTTT ngày23/12/2013 của Bộ trưởng Bộ Thông tin và Truyền thông Công bố Danh mục tiêu chuẩn kỹ thuật về ứng dụng công nghệ thông tin trong cơ quan nhà nước quy định Bắt buộc áp dụng tiêu chuẩn TCVN 6909:2001 và được xếp vào nhóm Tiêu chuẩn về truy cập thông tin.

1375 Go top

ĐĂNG CÂU HỎI