Giản hóa phân tử tuyến tính thâu nhập quy phạm
Thử điều mụcNhu yếuBiên tu,Dĩ xác bảo văn pháp,Dụng từ, ngữ khí,Cách thức,Tiêu điểmĐẳng sử dụng kháp đương.(2023 niên 3 nguyệt 3 nhật) |
Khoách triển danh |
.smi |
---|---|
Hỗ liên võngMôi thể loại hình |
chemical/x-daylight-smiles |
Cách thức loại hình | Hóa học văn kiện cách thức |
Giản hóa phân tử tuyến tính thâu nhập quy phạm( anh ngữ:Simplified molecular input line entry specification,Giản xưng SMILES ), thị nhất chủng dụngASCIITự phù xuyến minh xác miêu thuậtPhân tửKết cấu đích quy phạm.
SMILES tự phù xuyến khả dĩ bị đại đa sổ phân tử biên tập nhuyễn kiện đạo nhập tịnh chuyển hoán thành nhị duy đồ hình hoặc phân tử đích tam duy mô hình. Chuyển hoán thành nhị duy đồ hình khả dĩ sử dụng Helson đích “Kết cấu đồ sinh thành toán pháp” ( Structure Diagram Generation algorithms )[1].
Tối sơ đích SMILES quy phạm thủy vu 1980 niên đại, dĩ kinh bị đa thứ tu cải hòa khoách triển. 2007 niên, khai nguyên hóa học xã khu khai phát liễu nhất cá danh vi OpenSMILES đíchKhai phóng tiêu chuẩn.
Lịch sử
[Biên tập]Tối sơ đích SMILES quy phạm do David Weininger tại 1980 niên đại tạiĐức lư tưĐích USEPA đại lục sinh thái bộ thật nghiệm thất phát khởi.[2][3][4][5]Cảm tạ tha môn tại tảo kỳ khai phát trung đích cống hiến: “Gilman Veith hòa Rose Russo (USEPA) dĩ cập Albert Leo hòa Corwin Hansch (Pomona College) chi trì giá hạng công tác, dĩ cập Arthur Weininger (Pomona; Daylight CIS) hòa Jeremy Scofield (Cedar River Software, Renton, WA) vi hệ thống biên trình đề cung bang trợ.”[6]Hoàn cảnh bảo hộ thựTư trợ liễu khai phát SMILES đích sơ thủy hạng mục.[7][8]
Tha dĩ bị kỳ tha nhân hoặc tổ chức tu cải hòa khoách triển, lệ như nhật quang hóa học tín tức hệ thống ( Daylight Chemical Information Systems ). 2007 niên, Blue Obelisk khai nguyên hóa học xã khu khai phát liễu nhất cá danh vi “OpenSMILES” đíchKhai phóng tiêu chuẩn.Kỳ tha tự phù xuyến phù hào biểu kỳ phương pháp bao quátWiswesser Line Notation(WLN), ROSDAL hòa SLN (Tripos Inc).
2006 niên 7 nguyệt, IUPAC dẫn nhập liễu InChI tác vi công thức biểu kỳ đích tiêu chuẩn. Thông thường nhận vi SMILES bỉ InChI cụ hữu canh dịch vu nhân loại khả độc đích ưu điểm; tha hoàn ủng hữu quảng phiếm đích nhuyễn kiện chi trì cơ sở, cụ hữu quảng phiếm đích lý luận chi trì ( lệ như đồ luận ).
Thuật ngữ
[Biên tập]Thuật ngữ SMILES thị chỉ dụng vu biên mã phân tử kết cấu đích hành phù hào, đặc định thật lệ ứng nghiêm cách xưng vi SMILES tự phù xuyến. Nhiên nhi, thuật ngữ SMILES dã thường dụng vu chỉ đan cá SMILES tự phù xuyến hòa đa cá SMILES tự phù xuyến. Xác thiết đích hàm nghĩa thông thường tòng thượng hạ văn trung hiển nhi dịch kiến. Đương ứng dụng vu SMILES thời, thuật ngữ “Quy phạm” hòa “Dị cấu” khả năng hội đạo trí nhất ta hỗn hào. Giá ta thuật ngữ miêu thuật liễu SMILES tự phù xuyến đích bất đồng chúc tính, tịnh bất tương hỗ bài xích.
Khả dĩ vi nhất cá phân tử thông thường cụ hữu đa cá đồng dạng hữu hiệu đích SMILES tự phù xuyến. Lệ như,CCO
,OCC
HòaC(O)C
Đô chỉ định liễuẤt thuầnĐích kết cấu. Vi cấp định đích phân tử sinh thành tương đồng đích SMILES tự phù xuyến đích toán pháp dĩ kinh bị khai phát hoàn tất; giá ta toán pháp tại hứa đa khả năng đích tự phù xuyến trung chỉ tuyển trạch kỳ trung nhất cá. Y lại vu dụng vu sinh thành tha đích quy phạm hóa toán pháp, giá cá SMILES đối vu mỗi cá kết cấu đô thị duy nhất đích, giá cá SMILES bị xưng vi quy phạm SMILES. Giá ta toán pháp thủ tiên tương SMILES chuyển hoán vi phân tử kết cấu đích nội bộ biểu kỳ; nhiên hậu toán pháp hội kiểm tra cai kết cấu tịnh sinh thành duy nhất đích SMILES tự phù xuyến. Hạ diện thị nhất ta bao hàm dụng vu sinh thành quy phạm SMILES đích toán pháp đích công cụ, bao quát Daylight Chemical Information Systems,OpenEye Scientific Software,MEDIT,Chemical Computing Group,MolSoft LLC hòaChemistry Development KitĐích toán pháp. Quy phạm SMILES đích nhất cá thường kiến ứng dụng thị tác dẫn tịnh xác bảoSổ cư khốTrung phân tử đích duy nhất tính.
Miêu thuật CANGEN[9]Toán pháp đích nguyên thủy luận văn thanh xưng khả dĩ vi biểu kỳ phân tử đích đồ hình sinh thành duy nhất đích SMILES tự phù xuyến, đãn cai toán pháp tại hứa đa giản đan tình huống hạ đô thất bại liễu ( lệ nhưcuneane,1,2- nhị hoàn bính cơ ất hoàn ) tịnh thả bị nhận vi bất năng sử dụng chính xác đích phương pháp điển hình địa biểu kỳ đồ hình.[10]Mục tiền một hữu khóa thương nghiệp nhuyễn kiện đích hệ thống bỉ giác lai trắc thí giá ta nhuyễn kiện bao trung thị phủ tồn tại thử loại khuyết hãm.
SMILES phù hào duẫn hứa chỉ địnhTứ diện thể trung tâm đích phối tríHòa song kiện kỉ hà hình trạng. Giá ta thị bất năng cận do liên tiếp tính chỉ định đích kết cấu đặc chinh, nhân thử biên mã thử tín tức đích SMILES xưng vi dị cấu SMILES. Giá ta quy tắc đích nhất cá hiển trứ đặc chinh thị tha môn duẫn hứa đối thủ tính tiến hành nghiêm cách đích bộ phân thuyết minh. Thuật ngữ dị cấu SMILES dã thích dụng vu chỉ địnhDị cấu thểĐích SMILES.
Cơ vu đồ đích định nghĩa
[Biên tập]Tựu cơ vu đồ đích kế toán quá trình nhi ngôn, SMILES thị thông quáThâm độ ưu tiên biến lịchPhân tử kết cấu thứcĐích trung ngộ đáo đích phù hào tiết điểm hoạch đắc đích tự phù xuyến. Thủ tiên khứ trừ đồ nội đích khinh nguyên tử, nhiên hậu đả khai hoàn dĩ tương kỳ biến thànhSinh thành thụ.Tại hoàn trung đoạn đích địa phương sáp nhập bao hàm sổ tự hậu chuế đích tiêu thiêm ( tương đồng sổ tự đích tiết điểm biểu kỳ cai lưỡng cá nguyên tử tương liên ). Quát hào dụng vu biểu kỳ chi liên.
Sinh thành đích SMILES hình thức thủ quyết vu tuyển trạch:
- Tuyển trạch đả phá chu kỳ đíchHóa học kiện
- Dụng vuThâm độ ưu tiên biến lịchĐích khởi thủy nguyên tử
- Thuận tự quy tắc
SMILES định nghĩa vi thượng hạ văn vô quan ngữ ngôn đích tự phù xuyến
[Biên tập]Tòng hình thức ngữ ngôn lý luận đích giác độ lai khán, SMILES thị nhất cá từ. SMILES khả dĩ dụng thượng hạ văn vô quan đích giải tích khí giải tích. Cơ vu tương tự phân tử cụ hữu tương tự đặc tính đích hóa học tín tức học đích chủ yếu nguyên lý, giá chủng biểu kỳ đích sử dụng nhất trực dụng vu dự trắc sinh hóa đặc tính ( bao quát độc tính hòaSinh vật hàng giải tính). Dự trắc mô hình thật hiện liễu cú pháp mô thức thức biệt phương pháp ( thiệp cập định nghĩa phân tử cự ly )[11],Dĩ cập cơ vu thống kế mô thức thức biệt đích canh cường đại đích phương án.[12]
Điển phạm SMILES
[Biên tập]Điển phạm SMILES bảo chứng mỗi cá hóa học phân tử chỉ hữu nhất cá SMILES biểu đạt thức, thường dụng vu phân tửSổ cư khốĐích tác dẫn.
Ký pháp
[Biên tập]Nguyên tử
[Biên tập]Nguyên tửDo phương quát hào trung đíchHóa học nguyên tốĐích tiêu chuẩn súc tả biểu kỳ, lệ như[Au]
Biểu kỳKim.Tại dĩ hạ nguyên tử đích thường kiến tình huống hạ khả dĩ tỉnh lược quát hào:
- Chúc vuB,C,N,O,P,S,F,Cl,BrHoặcIĐích “Hữu cơ tử tập”
- Một hữuHình thức điện hà
- Cụ hữu SMILES hóa hợp giới mô hình sở ám kỳ đích khinh đích sổ lượng ( thông thường thị tha môn đích chính thường hóa hợp giới, đãn đối vu N hòa P, tha thị 3 hoặc 5, đối vu S, tha thị 2, 4 hoặc 6 )
- Thị chính thườngĐồng vị tố
- Bất thịThủ tính trung tâm
Sở hữu kỳ tha nguyên tố tất tu dụng quát hào quát khởi lai, tịnh minh xác hiển kỳ điện hà hòa khinh. Lệ như,ThủyĐích SMILES khả dĩ tả viO
Hoặc[OH2]
.Khinh dã khả dĩ tả thành nhất cá đan độc đích nguyên tử; thủy dã khả dĩ tả thành[H]O[H]
.
Sử dụng quát hào thời, như quả quát hào trung đích nguyên tử dữ nhất cá hoặc đa cá khinh kiện hợp, tắc thiêm gia phù hàoH
,Như quả đại vu 1, tắc thiêm gia khinh nguyên tử sổ, nhiên hậu thiêm gia phù hào+
Biểu kỳ chính điện hà hoặc-
Biểu kỳ phụ điện hà. Lệ như,[NH4+]
Biểu kỳAn(NH+
4). Như quả hữu đa cá điện hà, thông thường tả vi sổ tự; đãn thị, dã khả dĩ căn cư ly tử đích điện hà đa thứ trọng phục cai phù hào: Đối vuThái(IV) Ti4+,Khả dĩ tả vi[Ti+4]
Hoặc[Ti++++]
.Nhân thử, khinh dưỡngCăn âm ly tử(OH−
) do[OH-]
Biểu kỳ,Thủy hợp khinhDương ly tử (H3O+) thị[OH3+]
,Cỗ(III)Dương ly tử(Co3+) thị[Co+3]
Hoặc[Co+++]
.
Hóa học kiện
[Biên tập]Sử dụng kỳ trung nhất cá phù hào biểu kỳ kiện.- = # $: / \
.
Trừ phi lánh hữu thuyết minh, phủ tắcChi phương tộc hóa hợp vậtNguyên tử chi gian đích kiện bị giả định vi đan kiện, tịnh thả thông quá SMILES tự phù xuyến trung đích lân tiếp lai ám kỳ. Tuy nhiên đan kiện khả dĩ tả vi-
,Đãn thông thường tỉnh lược. Lệ như,Ất thuầnĐích SMILES khả dĩ tả thànhCCO
,CC-O
HoặcC-CO
,Đãn thông thường tả thànhCCO
.
Song kiện, tam kiện hòa tứKiệnPhân biệt dụng phù hào=
,#
Hòa$
Biểu kỳ, như SMILESO=C=O
(Nhị dưỡng hóa thán),C#N
(Tình hóa khinhHCN ) hòa[Ga+]$[As-]
(Thân hóa gia).
Lánh nhất chủng kiện thị “Bất thành kiện”, dụng biểu kỳ.
,Biểu kỳ lưỡng cá bộ phân một hữu niêm hợp tại nhất khởi. Lệ như,Lục hóa nộtThủy dung dịch khả tả vi[Na+].[Cl-]
Hiển kỳ giải ly.
Phương hương vị hóa hợp vậtĐích phương hương kiện khả dĩ dụng:
,Kiến hạ diện đích§ hoàn.
Dữ song kiện tương lân đích đan kiện khả dĩ sử dụng/
Hoặc\
Biểu kỳ lập thể hóa học cấu hình; kiến hạ diện đích§ lập thể hóa học.
Hoàn
[Biên tập]Vi liễu hình thành vô hoàn kết cấu, nhu yếu tại sở hữu hoàn đích nhậm ý điểm ( mỗ ta đặc định đích tuyển trạch khả năng hội sử kết quả canh giản minh ) đả đoạn. Thiêm gia sổ tự tiêu thiêm dĩ hiển kỳ bất tương lân nguyên tử chi gian đích liên tiếp tính.
Lệ như,Hoàn kỷ hoànHòaNhị 𫫇 hoànKhả dĩ phân biệt tả thànhC1CCCCC1
HòaO1CCOCC1
.Ngã môn tương đệ nhị cá hoàn đích thuận tự biên vi 2, lệ như,Thập khinh hóa nạiKhả dĩ tả viC1CCCC2C1CCCC2
.
Giá thị nhất ta phù hợp SMILES quy phạm đãn ngận thiếu dụng đích hoàn hào biên mã phương pháp:
- Hoàn hào đích thuận tự khả dĩ thị nhậm ý đích
- Tại hoàn kết thúc chi hậu khả dĩ trọng dụng hoàn hào
- Khả dĩ sử dụng 0 tác vi hoàn hào
Đãn thị giá thông thường hội sử SMILES canh nan duyệt độc. Lệ như,Hoàn kỷ cơ hoàn kỷ hoànThông thường tả viC1CCCCC1C2CCCCC2
,Đãn dã khả năng tả viC0CCCCC0C0CCCCC0
.
Đan cá nguyên tử hậu đích đa cá sổ tự biểu kỳ đa cá bế hoàn kiện. Lệ như, thập khinh hóa nại đích lánh nhất chủng SMILES phù hào thịC1CCCC2CCCCC12
,Kỳ trung tối chung đích thán đồng thời kết thúc liễu hoàn 1 hòa hoàn 2.
Như quả nhu yếu lưỡng vị sổ đích hoàn hào, tắc tiêu thiêm tiền diện hữu%
,Nhân thửC%12
Thị hoàn 12 đích đan cá bế hoàn kiện.
Hoàn hào tiền diện khả dĩ hữu nhất cá hóa học kiện phù hào dụng dĩ chỉ kỳ bế hoàn kiện đích loại hình. Lệ như,Hoàn bính hiThông thường tả tácC1=CC1
,Đãn như quả tuyển trạch song kiện tác vi bế hoàn kiện, tắc khả dĩ tả tácC=1CC1
,C1CC=1
HoặcC=1CC=1
( tẫn lượng sử dụngC1=CC1
). Bất khả dĩ đối đồng nhất cá bế hoàn kiện chỉ định đa chủng loại hình, nhân thửC=1CC-1
Thị phi pháp đích.
Ring-closing bonds may not be used to denote multiple bonds. For example,
C1C1
is not a valid alternative toC=C
for ethylene.However, they may be used with non-bonds;C1.C2.C12
is a peculiar but legal alternative way to write propane, more commonly writtenCCC
.
Bế hoàn kiện bất năng dụng vu biểu kỳ đa trọng kiện. Lệ nhưẤt hi,C1C1
Bất thịC=C
Đích hữu hiệu thế đại phẩm. Đãn tha môn khả dĩ dữ bất thành kiện nhất khởi sử dụng;C1.C2.C12
Thị nhất chủng đặc thù đãn hợp pháp đích thư tảBính hoànĐích thế đại phương thức, canh thường kiến đích thị thư tảCCC
.
Tuyển trạch dữ chi liên tương lân đích đoạn hoàn điểm khả dĩ đắc xuất canh giản đan đích SMILES hình thức. Lệ như,1,2- hoàn kỷ nhị thuầnTối giản đan địa tả viOC1CCCCC1O
.Tuyển trạch bất đồng đích vị trí đoạn hoàn hội sản sinh nhất cá phân chi kết cấu.
Phương hương hoàn
[Biên tập]Chư nhưBổnChi loại đíchPhương hươngHoàn khả dĩ tả thành dĩ hạ tam chủng hình thức chi nhất:
- Cụ hữu giao thế đan kiện hòa song kiện đíchKhải khố lặcThức
CC=CC=C1
- Sử dụng phương hương kiện phù hào
:
,Lệ nhưC1:C:C:C:C:C1
- Tối thường kiến đích thị, thông quá phân biệt dĩ tiểu tả hình thức
b
,c
,n
,o
,p
Hòas
Biên tả cấu thành B, C, N, O, P hòa S nguyên tử
Tại tối hậu nhất chủng tình huống hạ, duẫn hứa vị chỉ xuất lưỡng cá phương hương nguyên tử chi gian đích kiện thị phương hương kiện. Nhân thử,Bổn,Ti địnhHòaPhu namKhả dĩ phân biệt dụng SMILESc1ccccc1
,n1ccccc1
Hòao1cccc1
.
TạiTi lạcTrung phát hiện đích dữ khinh kiện hợp đích phương hương đạm tất tu biểu kỳ vi[nH]
;Nhân thửMễ tọaDụng SMILES biểu kỳ pháp tả vin1c[nH]cc1
.
Đương phương tộc nguyên tử bỉ thử đan kiện thời, tất tu minh xác hiển kỳ đan kiện. Lệ nhưLiên bổnc1ccccc1-c2ccccc2
.Giá thị nhu yếu đan kiện phù hào-
Đích thiếu sổ tình huống chi nhất. ( thật tế thượng đại đa sổ SMILES nhuyễn kiện khả dĩ chính xác thôi đoạn xuất lưỡng cá hoàn chi gian đích kiện bất năng thị phương hương đích, nhân thử hội tiếp thụ phi tiêu chuẩn hình thứcc1ccccc1c2ccccc2
)
Dụng vu sinh thành quy phạm SMILES đích Daylight hòa OpenEye toán pháp tại xử lý phương hương tính phương diện hữu sở bất đồng.
Phân chi
[Biên tập]Chi liên dụng quát hào miêu thuật, nhưBính toanĐíchCCC(=O)O
HòaPhất phảngĐíchFC(F)F
.Quát hào nội đích đệ nhất cá nguyên tử hòa quát hào nội đích cơ đoàn chi hậu đích đệ nhất cá nguyên tử đô dữ tương đồng đích phân chi điểm nguyên tử kiện hợp. Hóa học kiện phù hào tất tu xuất hiện tại quát hào nội, ngoại bộ ( lệ như:CCC=(O)O
) vô hiệu.
Thủ đại đích hoàn khả dĩ dụng hoàn trung đích phân chi điểm thư tả, như biên mã 3 hòa 4- tình cơ bổn giáp mê dị cấu thể đích SMILESCOc(c1)cccc1C#N
(Kiến đồ phiến(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ) hòaCOc(cc1)ccc1C#N
(Kiến đồ phiến) sở kỳ. Dĩ giá chủng phương thức vi thế đại hoàn biên tả SMILES khả dĩ sử tha môn canh dịch vu duyệt độc.
Khả dĩ án nhậm hà thuận tự biên tả phân chi. Lệ như,Nhị phất nhất lục nhất xú giáp hoànKhả tả viFC(Br)(Cl)F
,BrC(F)(F)Cl
,C(F)(Cl)(F)Br
Đẳng. Thông thường, như quả giác giản đan đích phân chi xuất hiện tại tối tiền diện, tắc SMILES biểu đan tối dung dịch duyệt độc, tối hậu đích vị gia quát hào đích bộ phân thị tối phục tạp đích. Giá chủng trọng tân bài liệt đích duy nhất cảnh cáo thị:
- Như quả hoàn hào bị trọng phục sử dụng, tha môn tương căn cư tha môn tại SMILES tự phù xuyến trung xuất hiện đích thuận tự tiến hành phối đối. Khả năng nhu yếu tiến hành nhất ta điều chỉnh dĩ bảo trì chính xác đích phối đối
- Như quả chỉ định liễu lập thể hóa học, tắc tất tu tiến hành điều chỉnh
Bất nhu yếu quát hào đích nhất chủng phân chi hình thức thị bế hoàn kiện. Tại hợp thích đích vị trí đoạn hoàn năng giảm thiếu quát hào đích sổ lượng. Lệ như,Giáp bổnThông thường tả thànhCc1ccccc1
Hoặcc1ccccc1C
,Tị miễn tả thànhc1cc(C)ccc1
Hoặcc1cc(ccc1)C
Thời sở nhu đích quát hào.
Lập thể hóa học
[Biên tập]SMILES duẫn hứa đãn bất yếu cầu đốiLập thể dị cấu thểTiến hành quy phạm.
Song kiện chu vi đích phối trí sử dụng tự phù/
Hòa\
Chỉ định, dĩ hiển kỳ dữ song kiện tương lân đích định hướng đan kiện. Lệ như,F/C=C/F
(Kiến đồ kỳ(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ) thịPhản-1,2- nhị phất ất hi đích nhất chủng biểu kỳ, kỳ trung phất nguyên tử vị vu song kiện đích tương đối lưỡng trắc ( như đồ sở kỳ ), nhiF/C=C\F
(Kiến đồ kỳ) thịThuận-1,2- nhị phất ất hi đích nhất chủng khả năng biểu kỳ hình thức, kỳ trung phất vị vu song kiện đích đồng nhất trắc.
Kiện phương hướng phù hào tổng thị dĩ chí thiếu lưỡng cá vi nhất tổ xuất hiện, kỳ trung đệ nhất cá thị nhậm ý đích. Dã tựu thị thuyết,F\C=C\F
DữF/C=C/F
Tương đồng. Đương tồn tại giao thế đích đan song kiện thời, cơ đoàn đại vu lưỡng cá, trung gian phương hướng phù hào dữ lưỡng cá song kiện tương lân. Lệ như, (2,4)- kỷ nhị hi đích thường kiến hình thức tả tácC/C=C/C=C/C
(Kiến đồ kỳ(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ).
Tác vi nhất cá canh phục tạp đích lệ tử,β- hồ la bặc tốHữu nhất cá ngận trường đích đan kiện hòa song kiện giao thế đích chủ liên, khả dĩ tả thànhCC1CCC/C(C)=C1/C=C/C(C)=C/C=C/C(C)=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C2=C(C)/CCCC2(C)C
(Kiến đồ kỳ(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ).
Thủ tính thánĐích thuận tự do@
Hoặc@@
Chỉ định. Án tòng tự phù xuyến tả trắc đáo hữu trắc đích thuận tự dĩThuận tự quy tắcKhảo lự tứ cá kiện. Tòng đệ nhất cá kiện đích giác độ khán hướng thán, kỳ tha tam cá thị thuận thời châm@@
Hoặc nghịch thời châm@
( nhân vi@
Phù hào bổn thân thị nghịch thời châm loa toàn ).
Lệ như, khảo lựBính an toan.Tha đích SMILES hình thức chi nhất thịNC(C)C(=O)O
,Canh hoàn chỉnh địa tả viN[CH](C)C(=O)O
.L-Bính an toan,Canh thường kiến đích nhất chủngĐối ánh dị cấu thể,Tả tácN[C@@H](C)C(=O)O
(Kiến miêu thuật(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ). Tòng đạm thán kiện khán, khinh (H
), giáp cơ (C
) hòa thoa toan diêm (C(=O)O
) cơ đoàn thuận thời châm xuất hiện.D- bính an toan khả dĩ tả thànhN[C@H](C)C(=O)O
(Kiến miêu thuật(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ).
Tuy nhiên tại SMILES trung chỉ định phân chi đích thuận tự thông thường tịnh bất trọng yếu, đãn tại giá chủng tình huống hạ tha ngận trọng yếu; giao hoán nhậm hà lưỡng cá tổ nhu yếu phản chuyển thủ tính chỉ tiêu. Như quả phân chi điên đảo, nhân thử bính an toan tả viNC(C(=O)O)C
,Na ma phối trí dã hội điên đảo;L-Bính an toan tả viN[C@H](C(=O)O)C
(Kiến miêu thuật(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) ). Kỳ tha tả pháp bao quátC[C@H](N)C(=O)O
,OC(=O)[C@@H](N)C
HòaOC(=O)[C@H](C)N
.
Đệ nhất cá kiện thông thường xuất hiện tại thủ tính thán nguyên tử đích tả trắc, đãn như quả SMILES dĩ thủ tính thán khai đầu, lệ nhưC(C)(N)C(=O)O
,Na ma sở hữu tứ cá kiện đô thị hữu biên. Đãn tối tiên xuất hiện đích ( tại giá chủng tình huống hạ thị[CH]
Kiện ) bị dụng tác đối dĩ hạ tam cá tiến hành bài tự đích tham khảo:L- bính an toan dã khả dĩ tả tác[C@@H](C)(N)C(=O)O
.
SMILES quy phạm bao quát đối@
Phù hào đích tường tế thuyết minh, dĩ chỉ kỳ canh phục tạp đích thủ tính trung tâm chu vi đích lập thể hóa học, lệ nhưSong tam giác trùy hình phân tử cấu hình.
Đồng vị tố
[Biên tập]Đồng vị tốĐích chỉ định sổ tự đẳng vu nguyên tử phù hào tiền đích chỉnh sổ đồng vị tố chất lượng. Kỳ trung nhất cá nguyên tử thịThán 14ĐíchBổnTả thành[14c]1ccccc1
,Đao đại lục phảngTả thành[2H]C(Cl)(Cl)Cl
.
Lệ tử
[Biên tập]Phân tử | Kết cấu | SMILES |
---|---|---|
Đạm khí | N≡N | N#N
|
Dị tình toan giáp chỉ (MIC) | CH3−N=C=O | CN=C=O
|
Lưu toan đồng (II) | Cu2+SO2− 4 |
[Cu+2].[O-]S(=O)(=O)[O-]
|
Hương lan tố | O=Cc1ccc(O)c(OC)c1 COc1cc(C=O)ccc1O
| |
Thốn hắc kích tố(C13H16N2O2) | CC(=O)NCCC1=CNc2c1cc(OC)cc2 CC(=O)NCCc1c[nH]c2ccc(OC)cc12
| |
Mỹ nông ninh G(C17H15N2) | CCc(c1)ccc2[n+]1ccc3c2[nH]c4c3cccc4 CCc1c[n+]2ccc3c4ccccc4[nH]c3c2cc1
| |
Ni cổ đinh(C10H14N2) | CN1CCC[C@H]1c2cccnc2
| |
Ngư vĩ tảo độc tố (C17H22O2) | CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO CCC[C@@H](O)CC/C=C/C=C/C#CC#C/C=C/CO
| |
Trừ trùng cúc tốII(C22H28O5) | CC1=C(C(=O)C[C@@H]1OC(=O)[C@@H]2[C@H](C2(C)C)/C=C(\C)/C(=O)OC)C/C=C\C=C
| |
Hoàng khúc môi độc tốB1(C17H12O6) | O1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5
| |
Bồ đào đường(β-D-Ti nam bồ đào đường )(C6H12O6) | OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)1
| |
Nham bạch thái tố (C14H16O9) | OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H]2[C@@H]1c3c(O)c(OC)c(O)cc3C(=O)O2
| |
Gia lợi phúc ni áGiới xác trùngĐích nhất chủngTín tức tố | CC(=O)OCCC(/C)=C\C[C@H](C(C)=C)CCC=C
| |
(2S,5R)-Chalcogran
Thụ bì giáp trùngPityogenes chalcographus[13]ĐíchTín tức tố |
CC[C@H](O1)CC[C@@]12CCCO2
| |
α-Thujone(C10H16O) | CC(C)[C@@]12C[C@@H]1[C@@H](C)C(=O)C2
| |
Lưu án tố( duy sinh tố B1)(C12H17N4OS+) | OCCc1c(C)[n+](cs1)Cc2cnc(C)nc2N
|
Vi liễu thuyết minh cụ hữu siêu quá 9 cá hoàn đích phân tử, thỉnh khảo lự đầu bào tha đinh -1,[14]Nhất chủng cụ hữuKinh nghiệm thứcC54H74N2O10Đích tai thể 13 hoànTi tần,TòngẤn độ dươngBán tích tác động vậtCephalodiscusgilchristiTrung phân ly xuất lai:
Tòng đồ trung tối tả biên đích giáp cơ khai thủy:
CC(C)(O1)C[C@@H](O)[C@@]1(O2)[C@@H](C)[C@@H]3CC=C4[C@]3(C2)C(=O)C[C@H]5[C@H]4CC[C@@H](C6)[C@]5(C)Cc(n7)c6nc(C[C@@]89(C))c7C[C@@H]8CC[C@@H]%10[C@@H]9C[C@@H](O)[C@@]%11(C)C%10=C[C@H](O%12)[C@]%11(O)[C@H](C)[C@]%12(O%13)[C@H](O)C[C@@]%13(C)CO
Chú ý%
Xuất hiện tại 9 dĩ thượng đích bế hoàn tiêu thiêm tác dẫn tiền diện; kiến§ hoànThượng diện đích§ hoàn.
SMILES đích kỳ tha lệ tử
[Biên tập]SMILES phù hào tại Daylight Chemical Information Systems đề cung đích SMILES lý luận thủ sách trung tiến hành liễu quảng phiếm đích miêu thuật, tịnh đề cung liễu hứa đa thuyết minh tính kỳ lệ. Daylight đích miêu hội thật dụng trình tự vi dụng hộ đề cung liễu kiểm tra tha môn tự kỷ đích SMILES kỳ lệ đích phương pháp, tịnh thả thị nhất chủng hữu giới trị đích giáo dục công cụ.
Phát triển
[Biên tập]SMARTSThị SMILES cơ sở chi thượng đích cải tiến bản.SMARTSTrung tăng gia đích nhất điểm thị, tha duẫn hứa sử dụngThông phối phùBiểu kỳ nguyên tử hòa hóa học kiện. Nhân thử, tha tại hóa hợp vật sổ cư khố trung quảng phiếm dụng vu kết cấu đích kế toán cơ hóa sưu tác. Giá chủng sưu tác đích cơ lý thị tiên thông quá thâu nhập đích SMILES thức trọng cấu hóa học thức, tái sưu tác tử đồ đích đồng hình; nhi bất thị trực tiếp thông quá SMILES thức đích đối bỉ hoàn thành đích.
USMILES( hữu thời thành vi quảng nghĩa SMILES ), giá chủng “Unique SMILES” thị nhật quang hóa học tín tức hệ thống hữu hạn công tư quan vu kết cấu đích quy phạm biểu đạt. Bất quản nội bộ nguyên tử đích biên mã thuận tự như hà, thông quá giá chủng toán pháp tổng khả dĩ đắc đáo quan vu hóa hợp vật quy phạm đích, vô kỳ nghĩa đích, duy nhất đích miêu thuật (Hóa học kết cấu biểu đạt đích duy nhất tính,Khả tham kiếnQuốc tế hóa hợp vật tiêu thức).
SMIRKS thị “reaction SMILES” đích siêu tập hòa “reaction SMARTS” đích tử tập, thị dụng vu chỉ định phản ứng biến hoán đích tuyến phù hào. Phản ứng khoách triển đích nhất bàn ngữ pháp thịREACTANT > AGENT > PRODUCT
( bất đái không cách ), kỳ trung nhậm hà tự đoạn khả dĩ lưu không hoặc điền sung dĩ điểm (.
) phân cách đích đa cá phân tử, dĩ cập kỳ tha y lại vu cơ bổn ngữ ngôn đích miêu thuật. Nguyên tử hoàn khả dĩ dụng sổ tự tiêu thức ( lệ như[C:1]
) dụng vu ánh xạ, lệ như[15]Tại.[16]
SMILES đối ứng vu ly tán đích phân tử kết cấu. Nhiên nhi, hứa đa tài liêu đô thị đại phân tử, tha môn thái đại ( nhi thả thông thường thị tùy cơ đích ), vô pháp phương tiện địa vi kỳ sinh thành SMILES. BigSMILES thị SMILES đích khoách triển, chỉ tại vi đại phân tử đề cung hữu hiệu đích biểu kỳ hệ thống.[17]
Chuyển hoán
[Biên tập]Khả dĩ sử dụng kết cấu đồ sinh thành (SDG) toán pháp tương SMILES chuyển hoán hồi nhị duy biểu kỳ.[18]SciFinder, ChemDraw quân khả thật hiện SMILES hòa kết cấu thức đích tương hỗ chuyển hoán.
Kỳ tha ký pháp cập bỉ giác
[Biên tập]Kỳ tha trứ danh đích tuyến tính ký pháp bao quátDuy tư uy hiết tuyến tính biểu kỳ thức(WiswesserLineNotation, WLN ), ROSDAL hòa SLN. Tối cậnQuốc tế thuần túy dữ ứng dụng hóa học liên hợp hộiThôi tiếnQuốc tế hóa hợp vật tiêu thứcTác vi tiêu chuẩn đíchPhân tử thứcBiểu đạt thức.
Nhiên nhi phổ biến nhận vi, SMILES dữ InChI tương bỉ canh cụ hữu ( đối nhân lai thuyết đích ) khả độc tính; nhi thả ngận đa nhuyễn kiện đô chi trì SMILES, kỳ trung bất thiếu nhuyễn kiện đô cụ hữu đồ luận đẳng phương diện đích lý luận cơ sở.
Lánh thỉnh tham chiếu
[Biên tập]- SMILES nhậm ý mục tiêu quy phạm(SMARTS), SMILES đích khoách triển, dụng vu quy phạm tử kết cấu tra tuân
- SYBYL Line Notation, lánh nhất chủng hành phù hào
- Quốc tế hóa học phẩm tiêu thức phù(InChI),IUPACĐích SMILES thế đại phẩm
- Molecular Query Language,Nhất chủngTra tuân ngữ ngôn,Dã duẫn hứa sổ trị chúc tính, lệ như vật lý hóa học trị hoặc cự ly
- Hóa học khai phát sáo kiện, nhị duy bố cục hòa chuyển hoán nhuyễn kiện
- OpenBabel, JOELib, OELib ( chuyển hoán )
Ngoại bộ liên tiếp
[Biên tập]- SMILES chỉ nam:http://www.daylight.com/smiles/index.html(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán)
- Tại tuyến SMILES thức nhị duy đồ phiến chuyển hoán nhuyễn kiện
- Năng sinh thành SMILES đích phân tử biên tập khí nhuyễn kiện:http://www.molinspiration.com/jme/index.html(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán)
- SMILES phân tích:http://www.dalkescientific.com/writings/diary/archive/(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán)
- Tự do SMILES chuyển hoán nhuyễn kiện:http://www.acdlabs.com/download/chemsk.html(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán)
- SMILES thức tam duy mô hình chuyển hoán nhuyễn kiện:http://jmol.sourceforge.net/(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán)
- JSDraw(Hiệt diện tồn đương bị phân,Tồn vuHỗ liên võng đương án quán) năng sinh thành SMILES
- SMILES Depictor
- ^Helson, Harold E. Structure Diagram Generation. Lipkowitz, Kenny B. ( biên ).Reviews in Computational Chemistry.Hoboken, NJ, USA: John Wiley & Sons, Inc. 2007-01-05: 313–398[2022-02-22].ISBN978-0-470-12590-8.doi:10.1002/9780470125908.ch6.( nguyên thủy nội dungTồn đươngVu 2022-04-21 ).
- ^SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. Journal of Chemical Information and Computer Sciences. February 1988,28(1): 31–6.doi:10.1021/ci00057a005.
- ^SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Modeling. May 1989,29(2): 97–101.doi:10.1021/ci00062a008.
- ^SMILES. 3. DEPICT. Graphical depiction of chemical structures. Journal of Chemical Information and Modeling. August 1990,30(3): 237–43.doi:10.1021/ci00067a005.
- ^https://wayback.archive-it.org/2118/20100925010036/http://64.251.202.97/pubs/asist2002/17-swanson.pdf
|chapterurl=
Khuyết thiếu tiêu đề (Bang trợ)(PDF).The Entrance of Informatics into Combinatorial Chemistry.Medford, NJ:Information Today.2004: 205.ISBN978-1-57387-229-4. - ^Acknowledgements on Daylight Tutorial smiles-etc page.1998[24 June2013].( nguyên thủy nội dungTồn đươngVu 2022-04-24 ).
- ^SMILES: A line notation and computerized interpreter for chemical structures(PDF).Duluth, MN:U.S. EPA,Environmental Research Laboratory-Duluth. 1987[2022-04-18].Report No. EPA/600/M-87/021. ( nguyên thủy nội dungTồn đương(PDF)Vu 2022-04-11 ).
- ^SMILES Tutorial: What is SMILES?.U.S. EPA.[2012-09-23].(Nguyên thủy nội dungTồn đương vu 28 March 2008 ).
- ^SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Modeling. May 1989,29(2): 97–101.doi:10.1021/ci00062a008.
- ^https://doi.org/10.1007%2F11530084_13
|chapterurl=
Khuyết thiếu tiêu đề (Bang trợ).Assigning Unique Keys to Chemical Compounds for Data Integration: Some Interesting Counter Examples. Lecture Notes in Computer Science3615.Berlin: Springer. 2005: 145–157[2013-02-12].ISBN978-3-540-27967-9.doi:10.1007/11530084_13. - ^NLP-inspired structural pattern recognition in chemical application.. Pattern Recognition Letters. August 2014,45:11–16.doi:10.1016/j.patrec.2014.02.012.
- ^Bridging from syntactic to statistical methods: Classification with automatically segmented features from sequences.. Pattern Recognition. November 2015,48(11): 3749–3756.doi:10.1016/j.patcog.2015.05.001.
- ^Isolation of pheromone synergists of bark beetle,Pityogenes chalcographus, from complex insect-plant odors by fractionation and subtractive-combination bioassay. Journal of Chemical Ecology. March 1990,16(3): 861–876.PMID 24263601.doi:10.1007/BF01016496.
- ^CID 183413.PubChem.[May 12,2012].( nguyên thủy nội dungTồn đươngVu 2022-05-25 )( anh ngữ ).
- ^SMIRKS Tutorial.Daylight Chemical Information Systems, Inc.[29 October2018].( nguyên thủy nội dungTồn đươngVu 2022-06-15 ).
- ^Reaction SMILES and SMIRKS.Daylight Chemical Information Systems, Inc.[29 October2018].( nguyên thủy nội dungTồn đươngVu 2022-01-19 ).
- ^BigSMILES: A Structurally-Based Line Notation for Describing Macromolecules.ACS Central Science. September 2019,5(9): 1523–1531.PMC 6764162 .PMID 31572779.doi:10.1021/acscentsci.9b00476.
- ^Reviews in Computational Chemistry13.New York: Wiley-VCH. 1999: 313–398.ISBN978-0-470-12590-8.doi:10.1002/9780470125908.ch6.