Cất chứa
0Hữu dụng +1
0

Thông dụng nhiều tám vị mã hóa tự phù tập

Từ ISO chế định ISO 10646 ( hoặc xưng ISO/IEC 10646 ) tiêu chuẩn sở định nghĩa tiêu chuẩn tự phù tập
Từ đồng nghĩaISO 10646( tự phù tập quốc tế tiêu chuẩn đánh số ) giống nhau chỉ thông dụng nhiều tám vị mã hóa tự phù tập
Thông dụng nhiều tám vị mã hóa tự phù tập ( Universal Multiple-Octet Coded Character Set ) cũng kêuThông dụng tự phù tập( Universal Character Set, UCS ), là từISOChế địnhISO 10646( hoặc xưngISO/IEC 10646) tiêu chuẩn sở định nghĩa tiêu chuẩn tự phù tập.
Tiếng Trung danh
Thông dụng nhiều tám vị mã hóa tự phù tập
Ngoại văn danh
Universal Multiple-Octet Coded Character Set

Tóm tắt

Bá báo
Biên tập
Thông dụng nhiều tám vị mã hóa tự phù ba lương tập bao gồm mặt khác sở hữu tự phù tập. Nó bảo đảm cùng mặt khác tự phù tập song hướng kiêm dung, tức, nếu ngươi đem bất luận cái gì văn bản tự phù xuyến phiên dịch đến UCS cách thức, sau đó lại phiên dịch hồi nguyên mã hóa, ngươi sẽ không mất đi bất luận cái gì tin tức. UCS bao hàm đã biết ngôn ngữ sở hữu tự phù. Trừ bỏ tiếng Latinh, Hy Lạp ngữ, Slavic ngữ, Hebrew ngữ, tiếng Ảrập,Á mỹ ni á ngữ,Georgia ngữ, còn bao gồm tiếng Trung, tiếng Nhật, Hàn Văn như vậy khối vuông văn tự, UCS còn bao gồm đại lượng đồ hình, in ấn, toán học, khoa học ký hiệu. ISO/IEC 10646 định nghĩa một cái 31 vị tự phù tập. UCS không chỉ có cho mỗi cái tự phù phân phối một cái số hiệu, hơn nữa giao cho một cái chính thức tên. Tỏ vẻ một cái UCS hoặc Unicode giá trịMười sáu tiến chế sốThông thường ở phía trước hơn nữa “U+ toàn khuyên”, tỷ như “U+0041” bộ diễn chúc đại biểu tự phù “A”[1]Vượt mấy hưởng đêm thấm chỉnh mong tinh phù mao mộ rầm mà lang về.

Phiên bản

Bá báo
Biên tập
  • ISO/IEC 10646-1:1993 = Unicode 1.1 = GB 13000.1-93《 công nghệ thông tin thông dụng nhiều tám vị mã hóa tự phù tập ( UCS ) đệ nhất bộ phận: Hệ thống kết cấu cùng cơ bản nhiều văn loại mặt bằng 》.
  • ISO/IEC 10646-1:1993 plus Amendments 5 to 7 = Unicode 2.0
  • ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7, as well as two characters from Amendment 18 = Unicode 2.1[2]
  • ISO/IEC 10646-1:2000 = Unicode 3.0
  • ISO/IEC 10646-1:2000 and ISO/IEC 10646-2:2001 = Unicode 3.1
  • ISO/IEC 10646-1:2000 plus Amendment 1 and ISO/IEC 10646-2:2001 = Unicode 3.2
  • ISO/IEC 10646:2003 = Unicode 4.0 = GB 13000-2010
  • ISO/IEC 10646:2003 plus Amendment 1 = Unicode 4.1
  • ISO/IEC 10646:2003 plus Amendments 1 to 2 = Unicode 5.0 excluding Devanagari Letters GGA, JJA, DDDA and BBA, which are included in Amendment 3
  • ISO/IEC 10646:2003 plus Amendments 1 to 4 = Unicode 5.1
  • ISO/IEC 10646:2003 plus Amendments 1 to 6 = Unicode 5.2
  • ISO/IEC 10646:2003 plus Amendments 1 to 8 = ISO/IEC 10646:2011 = Unicode 6.0 excluding Indian Rupee Sign
  • ISO/IEC 10646:2012 = Unicode 6.1
  • ISO/IEC 10646:2012 = Unicode 6.2 excluding Turkish Lira Sign, which is included in Amendment 1
  • ISO/IEC 10646:2012 = Unicode 6.3 excluding Turkish Lira Sign, which is included in Amendment 1, and five bidirectional control characters (Arabic Letter Mark, Left-To-Right Isolate, Right-To-Left Isolate, First Strong Isolate, Pop Directional Isolate), which are included in Amendment 2
  • ISO/IEC 10646:2012 plus Amendments 1 and 2 = Unicode 7.0 excluding the Ruble sign
  • ISO/IEC 10646:2014 plus Amendment 1 = Unicode 8.0
  • ISO/IEC 10646:2014 plus Amendments 1 and 2 = Unicode 9.0 excluding Adlam, Newa, Japanese TV symbols, and 74 emoji and symbols
  • ISO/IEC 10646:2017 = Unicode 10.0 excluding 285 Hentaigana characters, 3 Zanabazar Square characters, and 56 emoji symbols
  • ISO/IEC 10646:2017 plus Amendment 1 = Unicode 11.0 excluding 46 Mtavruli Georgian capital letters, 5 CJK unified ideographs, and 66 emoji characters
  • ISO/IEC 10646:2017 plus Amendments 1 and 2 = Unicode 12.0 excluding 62 additional characters
  • ISO/IEC 10646:2020 = Unicode 13.0

Unicode cùng ISO 10646 quan hệ

Bá báo
Biên tập
Trong lịch sử tồn tại hai cái độc lập nếm thử sáng lập chỉ một tự phù tập tổ chức, tức
  • Quốc tế chuẩn hoá tổ chức ( ISO ) với 1984 năm sáng tạo ISO/IECJTC1/SC2/WG2, này hàm nghĩa là International Organization for Standardization / International Electrotechnical Commission, Joint Technical Committee #1 [Information Technology], Subcommittee #2 [Coded Character Sets], Working Group #2 [Multi-octet codes]). ISO 10646 tỏ vẻ đây là ISO 646 mở rộng.
  • Từ Xerox, Apple chờ phần mềm chế tạo thương với 1988 năm tạo thành thống nhất mã liên minh. Người trước khai phá ISO/IEC 10646 hạng mục, người sau khai phá thống nhất mã hạng mục. Bởi vậy lúc ban đầu chế định bất đồng tiêu chuẩn.
1991 năm trước sau, hai cái hạng mục tham dự giả đều nhận thức đến, thế giới không cần hai cái không kiêm dung tự phù tập. Vì thế, chúng nó bắt đầu xác nhập hai bên công tác thành quả, cũng vì sáng lập một cái chỉ một mã hóa biểu mà hợp tác công tác. 1991 năm, không bao hàm CJK thống nhất chữ Hán tập Unicode 1.0 tuyên bố. Theo sau, CJK thống nhất chữ Hán tập chế định với 1993 năm hoàn thành, tuyên bố ISO 10646-1:1993, tức Unicode 1.1.
Từ Unicode 2.0 bắt đầu, Unicode chọn dùng cùng ISO 10646-1 tương đồng tự kho cùng tự mã; ISO cũng hứa hẹn, ISO 10646 đem sẽ không thế vượt qua U+10FFFF UCS-4 mã hóa phú giá trị, lấy khiến cho hai người bảo trì nhất trí. Hai cái hạng mục vẫn đều độc lập tồn tại, cũng độc lập mà công bố từng người tiêu chuẩn. NhưngThống nhất mã liên minhCùng ISO/IEC JTC1/SC2 đều đồng ý bảo trì hai người tiêu chuẩn mã biểu kiêm dung, cũng chặt chẽ mà cộng đồng điều chỉnh bất luận cái gì tương lai mở rộng. Ở tuyên bố thời điểm, Unicode giống nhau đều sẽ chọn dùng có quan hệ tự mã nhất thường thấy tự thể, nhưng ISO 10646 giống nhau đều tận khả năng chọn dùng Century tự thể.

Unicode cùng ISO 10646 dị đồng

Bá báo
Biên tập
Thống nhất mã liên minh công bố Unicode tiêu chuẩn bao hàm ISO/IEC 10646-1 thực hiện cấp bậc 3Cơ bản nhiều văn loại mặt bằng.Ở hai cái tiêu chuẩn, sở hữu tự phù đều ở tương đồng vị trí hơn nữa có tương đồng tên. ISO/IEC 10646 tiêu chuẩn, tựa như ISO/IEC 8859 tiêu chuẩn giống nhau, chẳng qua là một cái đơn giản tự phù tập biểu. Nó định nghĩa một ít mã hóa biệt danh, chỉ định một ít cùng tiêu chuẩn có quan hệ thuật ngữ, cũng bao gồm quy phạm thuyết minh, chỉ định như thế nào sử dụng UCS liên tiếp mặt khác ISO tiêu chuẩn thực hiện, tỷ như ISO/IEC 6429 cùng ISO/IEC 2022. Còn có một ít cùng ISO chặt chẽ tương quan, tỷ như ISO/IEC 14651 là về UCS tự phù xuyến bài tự.
Unicode tiêu chuẩn, thêm vào định nghĩa rất nhiều cùng tự phù có quan hệ ngữ nghĩa khoa học. Unicode kỹ càng tỉ mỉ thuyết minh vẽ nào đó ngôn ngữ ( như tiếng Ảrập ) biểu đạt hình thức thuật toán, xử lý song hướng văn tự ( tỷ như tiếng Latin cùng Hebrew văn hỗn hợp văn tự ) thuật toán, bài tự cùng tự phù xuyến tương đối sở cần thuật toán, từ từ. Bởi vì Unicode này một người tự tương đối hảo nhớ, cho nên nó sử dụng càng vì rộng khắp. Bất quá giống nhau cho rằng, dùng cho đóng dấu ISO/IEC 10646-1 tiêu chuẩn tự thể ở nào đó phương diện chất lượng, muốn cao hơn Unicode 2.0. Hai người bộ phận dạng lệ hình chữ có lộ rõ khác nhau. ISO/IEC 10646-1 tiêu chuẩn đồng dạng sử dụng bốn loại bất đồng phong cách biến thể tới biểu hiện văn tự biểu ý như tiếng Trung, tiếng Nhật, Hàn Văn ( tức CJK ), nhưng Unicode 2.0 trong ngoài chỉ có tiếng Trung biến thể. Thậm chí tồn tại “Unicode đối Nhật Bản người dùng tới nói không thể tiếp thu” không thật truyền thuyết.