Nhảy chuyển tới nội dung

Đơn giản hoá phần tử tuyến tính đưa vào quy phạm

本页使用了标题或全文手工转换
Duy cơ bách khoa, tự do bách khoa toàn thư
( trọng định hướng tựSMILES)
SMILES
Mở rộng danh
.smi
InternetTruyền thông loại hình
chemical/x-daylight-smiles
Cách thức loại hìnhHóa học văn kiện cách thức
Hoàn Bính sa tinhSMILES sinh thành thuật toán: Mở ra hoàn, sau đó viết thành một cái chủ liên thượng chi nhánh hình thức

Đơn giản hoá phần tử tuyến tính đưa vào quy phạm( tiếng Anh:Simplified molecular input line entry specification,Tên gọi tắt SMILES ), là một loại dùngASCIITự phù xuyến minh xác miêu tảPhần tửKết cấu quy phạm.

SMILES tự phù xuyến có thể bị đại đa số phần tử biên tập phần mềm dẫn vào cũng thay đổi thành 2D đồ hình hoặc phần tử 3d mô hình. Thay đổi thành 2D đồ hình có thể sử dụng Helson “Kết cấu đồ sinh thành thuật toán” ( Structure Diagram Generation algorithms )[1].

Lúc ban đầu SMILES quy phạm bắt đầu từ 1980 niên đại, đã bị nhiều lần sửa chữa cùng mở rộng. 2007 năm, khai nguyên hóa học xã khu khai phá một cái tên là OpenSMILESMở ra tiêu chuẩn.

Lịch sử[Biên tập]

Lúc ban đầu SMILES quy phạm từ David Weininger ở 1980 niên đại ởĐức Lư tưUSEPA đại lục sinh thái bộ phòng thí nghiệm khởi xướng.[2][3][4][5]Cảm tạ bọn họ ở lúc đầu khai phá trung cống hiến: “Gilman Veith cùng Rose Russo (USEPA) cùng với Albert Leo cùng Corwin Hansch (Pomona College) duy trì cái này công tác, cùng với Arthur Weininger (Pomona; Daylight CIS) cùng Jeremy Scofield (Cedar River Software, Renton, WA) vì hệ thống biên trình cung cấp trợ giúp.”[6]Bảo vệ môi trường thựGiúp đỡ khai phá SMILES mới bắt đầu hạng mục.[7][8]

Nó đã bị những người khác hoặc tổ chức sửa chữa cùng mở rộng, tỷ như ánh nắng hóa học tin tức hệ thống ( Daylight Chemical Information Systems ). 2007 năm, Blue Obelisk khai nguyên hóa học xã khu khai phá một cái tên là “OpenSMILES”Mở ra tiêu chuẩn.Mặt khác tự phù xuyến ký hiệu tỏ vẻ phương pháp bao gồmWiswesser Line Notation(WLN), ROSDAL cùng SLN (Tripos Inc).

2006 năm 7 nguyệt, IUPAC dẫn vào InChI làm công thức tỏ vẻ tiêu chuẩn. Thông thường cho rằng SMILES so InChI có càng dễ dàng nhân loại nhưng đọc ưu điểm; nó còn có được rộng khắp phần mềm duy trì cơ sở, có rộng khắp lý luận duy trì ( tỷ như đồ luận ).

Thuật ngữ[Biên tập]

Thuật ngữ SMILES là chỉ dùng cho mã hóa phần tử kết cấu hành ký hiệu, riêng ví dụ thực tế ứng nghiêm khắc xưng là SMILES tự phù xuyến. Nhưng mà, thuật ngữ SMILES cũng thường dùng với chỉ đơn cái SMILES tự phù xuyến cùng nhiều SMILES tự phù xuyến. Xác thực hàm nghĩa thông thường từ trên dưới văn trung rõ ràng. Đương ứng dụng với SMILES khi, thuật ngữ “Quy phạm” cùng “Dị cấu” khả năng sẽ dẫn tới một ít lẫn lộn. Này đó thuật ngữ miêu tả SMILES tự phù xuyến bất đồng thuộc tính, cũng không lẫn nhau bài xích.

Có thể vì một cái phần tử thông thường có nhiều đồng dạng hữu hiệu SMILES tự phù xuyến. Tỷ như,CCO,OCCCùngC(O)CĐều chỉ địnhEtanolKết cấu. Vì cấp định phần tử sinh thành tương đồng SMILES tự phù xuyến thuật toán đã bị khai phá xong; này đó thuật toán ở rất nhiều khả năng tự phù xuyến trung chỉ lựa chọn trong đó một cái. Ỷ lại với dùng cho sinh thành nó quy phạm hoá thuật toán, cái này SMILES đối với mỗi cái kết cấu đều là duy nhất, cái này SMILES được xưng là quy phạm SMILES. Này đó thuật toán đầu tiên đem SMILES thay đổi vì phần tử kết cấu bên trong tỏ vẻ; sau đó thuật toán sẽ kiểm tra nên kết cấu cũng sinh thành duy nhất SMILES tự phù xuyến. Phía dưới là một ít bao hàm dùng cho sinh thành quy phạm SMILES thuật toán công cụ, bao gồm Daylight Chemical Information Systems,OpenEye Scientific Software,MEDIT,Chemical Computing Group,MolSoft LLC cùngChemistry Development KitThuật toán. Quy phạm SMILES một cái thường thấy ứng dụng là hướng dẫn tra cứu cũng bảo đảmCơ sở dữ liệuTrung phần tử duy nhất tính.

Miêu tả CANGEN[9]Thuật toán nguyên thủy luận văn công bố có thể vì tỏ vẻ phần tử đồ hình sinh thành duy nhất SMILES tự phù xuyến, nhưng nên thuật toán ở rất nhiều đơn giản dưới tình huống đều thất bại ( tỷ nhưcuneane,1,2- nhị hoàn Bính cơ Ất hoàn ) hơn nữa bị cho rằng không thể sử dụng chính xác phương pháp điển hình mà tỏ vẻ đồ hình.[10]Trước mắt không có vượt thương nghiệp phần mềm hệ thống tương đối tới thí nghiệm này đó phần mềm bao trung hay không tồn tại này loại khuyết tật.

SMILES ký hiệu cho phép chỉ địnhTứ phía thể trung tâm phối tríCùng song kiện bao nhiêu hình dạng. Này đó là không thể chỉ từ liên tiếp tính chỉ định kết cấu đặc thù, bởi vậy mã hóa này tin tức SMILES xưng là dị cấu SMILES. Này đó quy tắc một cái lộ rõ đặc thù là chúng nó cho phép đối thủ tính tiến hành nghiêm khắc bộ phận thuyết minh. Thuật ngữ dị cấu SMILES cũng áp dụng với chỉ địnhDị cấu thểSMILES.

Căn cứ vào đồ định nghĩa[Biên tập]

Liền căn cứ vào đồ tính toán quá trình mà nói, SMILES là thông quaChiều sâu ưu tiên biến lịchPhần tử kiểu kết cấuTrung gặp được ký hiệu tiết điểm đạt được tự phù xuyến. Đầu tiên đi trừ đồ nội hydro nguyên tử, sau đó mở ra hoàn lấy đem này biến thànhSinh thành thụ.Ở hoàn gián đoạn địa phương cắm vào bao hàm con số hậu tố nhãn ( tương đồng con số tiết điểm tỏ vẻ nên hai cái nguyên tử tương liên ). Dấu móc dùng cho tỏ vẻ chi liên.

Sinh thành SMILES hình thức quyết định bởi với lựa chọn:

SMILES định nghĩa vì trên dưới văn không quan hệ ngôn ngữ tự phù xuyến[Biên tập]

Từ hình thức ngôn ngữ lý luận góc độ tới xem, SMILES là một cái từ. SMILES có thể dùng tới bên dưới không quan hệ phân tích khí phân tích. Căn cứ vào tương tự phần tử có tương tự đặc tính hóa học tin tức học chủ yếu nguyên lý, loại này tỏ vẻ sử dụng vẫn luôn dùng cho đoán trước sinh hóa đặc tính ( bao gồm độc tính cùngSinh vật thoái biến tính). Đoán trước mô hình thực hiện cú pháp hình thức phân biệt phương pháp ( đề cập định nghĩa phần tử khoảng cách )[11],Cùng với căn cứ vào thống kê hình thức phân biệt càng cường đại phương án.[12]

Điển phạm SMILES[Biên tập]

Điển phạm SMILES bảo đảm mỗi cái hóa học phần tử chỉ có một cái SMILES biểu đạt thức, thường dùng với phần tửCơ sở dữ liệuHướng dẫn tra cứu.

Nhớ pháp[Biên tập]

Nguyên tử[Biên tập]

Nguyên tửTừ dấu móc trungNguyên tố hoá họcTiêu chuẩn viết tắt tỏ vẻ, tỷ như[Au]Tỏ vẻKim.Ở dưới nguyên tử thường thấy dưới tình huống có thể tỉnh lược dấu móc:

  1. Thuộc vềB,C,N,O,P,S,F,Cl,BrHoặcI“Hữu cơ tử tập”
  2. Không cóHình thức điện tích
  3. Có SMILES hoá trị mô hình sở ám chỉ hydro số lượng ( thông thường là chúng nó bình thường hoá trị, nhưng đối với N cùng P, nó là 3 hoặc 5, đối với S, nó là 2, 4 hoặc 6 )
  4. Là bình thườngChất đồng vị
  5. Không phảiTay tính trung tâm

Sở hữu nguyên tố khác cần thiết dùng dấu móc quát lên, cũng minh xác biểu hiện điện tích cùng hydro. Tỷ như,ThủySMILES có thể viết vìOHoặc[OH2].Hydro cũng có thể viết thành một cái đơn độc nguyên tử; thủy cũng có thể viết thành[H]O[H].

Sử dụng dấu móc khi, nếu dấu móc trung nguyên tử cùng một cái hoặc nhiều hydro kiện hợp, tắc tăng thêm ký hiệuH,Nếu lớn hơn 1, tắc tăng thêm hydro nguyên tử số, sau đó tăng thêm ký hiệu+Tỏ vẻ điện dương hà hoặc-Tỏ vẻ điện tích âm. Tỷ như,[NH4+]Tỏ vẻAmoni(NH+
4
). Nếu có bao nhiêu cái điện tích, thông thường viết số lượng tự; nhưng là, cũng có thể căn cứ ly tử điện tích nhiều lần lặp lại nên ký hiệu: Đối vớiThái(IV) Ti4+,Có thể viết vì[Ti+4]Hoặc[Ti++++].Bởi vậy, hydro oxyCăn i-on âm(OH
) từ[OH-]Tỏ vẻ,Sự Hy-đrát hoá hydroDương ly tử (H3O+) là[OH3+],Coban(III)Dương ly tử(Co3+) là[Co+3]Hoặc[Co+++].

Liên kết hoá học[Biên tập]

Sử dụng trong đó một cái ký hiệu tỏ vẻ kiện.- = # $: / \.

Trừ phi có khác thuyết minh, nếu khôngMỡ tộc hoá chấtNguyên tử chi gian kiện bị giả định vì đơn kiện, hơn nữa thông qua SMILES tự phù xuyến trung sát nhau tới ám chỉ. Tuy rằng đơn kiện có thể viết vì-,Nhưng thông thường tỉnh lược. Tỷ như,EtanolSMILES có thể viết thànhCCO,CC-OHoặcC-CO,Nhưng thông thường viết thànhCCO.

Song kiện, tam kiện cùng bốnKiệnPhân biệt dùng ký hiệu=,#Cùng$Tỏ vẻ, như SMILESO=C=O(CO2),C#N(Xyanogen hóa hydroHCN ) cùng[Ga+]$[As-](Thân hóa gia).

Một loại khác kiện là “Không thành kiện”, dùng tỏ vẻ.,Tỏ vẻ hai cái bộ phận không có dính hợp ở bên nhau. Tỷ như,Natri cloruaThủy dung dịch nhưng viết vì[Na+].[Cl-]Biểu hiện phân ly.

Hương thơm vị hoá chấtHương thơm kiện có thể dùng:,Thấy phía dưới§ hoàn.

Cùng song kiện liền nhau đơn kiện có thể sử dụng/Hoặc\Tỏ vẻ lập thể hóa học cấu hình; thấy phía dưới§ lập thể hóa học.

Hoàn[Biên tập]

Vì hình thành vô hoàn kết cấu, yêu cầu ở sở hữu hoàn tùy ý điểm ( nào đó riêng lựa chọn khả năng sẽ sử kết quả càng đơn giản rõ ràng ) đánh gãy. Tăng thêm con số nhãn lấy biểu hiện không liền nhau nguyên tử chi gian liên tiếp tính.

Tỷ như,Hoàn mình hoànCùngNhị 𫫇 hoànCó thể phân biệt viết thànhC1CCCCC1CùngO1CCOCC1.Chúng ta đem cái thứ hai hoàn trình tự biên vì 2, tỷ như,Mười hydro hóa nạiCó thể viết vìC1CCCC2C1CCCC2.

Đây là một ít phù hợp SMILES quy phạm nhưng rất ít dùng hoàn hào mã hóa phương pháp:

  • Hoàn hào trình tự có thể là tùy ý
  • Ở hoàn sau khi chấm dứt có thể trọng dụng hoàn hào
  • Có thể sử dụng 0 làm hoàn hào

Nhưng là này thông thường sẽ sử SMILES càng khó đọc. Tỷ như,Hoàn mình cơ hoàn mình hoànThông thường viết vìC1CCCCC1C2CCCCC2,Nhưng cũng khả năng viết vìC0CCCCC0C0CCCCC0.

Đơn cái nguyên tử sau nhiều con số tỏ vẻ nhiều bế hoàn kiện. Tỷ như, mười hydro hóa nại một loại khác SMILES ký hiệu làC1CCCC2CCCCC12,Trong đó cuối cùng than đồng thời kết thúc hoàn 1 cùng hoàn 2.

Nếu yêu cầu hai vị số hoàn hào, tắc nhãn phía trước có%,Bởi vậyC%12Là hoàn 12 đơn cái bế hoàn kiện.

Hoàn hào phía trước có thể có một cái liên kết hoá học ký hiệu dùng để chỉ thị bế hoàn kiện loại hình. Tỷ như,Hoàn PropyleneThông thường viết làmC1=CC1,Nhưng nếu lựa chọn song kiện làm bế hoàn kiện, tắc có thể viết làmC=1CC1,C1CC=1HoặcC=1CC=1( tận lực sử dụngC1=CC1). Không thể đối cùng cái bế hoàn kiện chỉ định nhiều loại loại hình, bởi vậyC=1CC-1Là phi pháp.

Ring-closing bonds may not be used to denote multiple bonds. For example,C1C1is not a valid alternative toC=Cfor ethylene.However, they may be used with non-bonds;C1.C2.C12is a peculiar but legal alternative way to write propane, more commonly writtenCCC.

Bế hoàn kiện không thể dùng cho tỏ vẻ nhiều trọng kiện. Tỷ nhưÊtilen,C1C1Không phảiC=CHữu hiệu thay thế phẩm. Nhưng chúng nó có thể cùng không thành kiện cùng nhau sử dụng;C1.C2.C12Là một loại đặc thù nhưng hợp pháp viếtBính hoànThay thế phương thức, càng thường thấy chính là viếtCCC.

Lựa chọn cùng chi liên liền nhau đoạn hoàn điểm có thể đến ra càng đơn giản SMILES hình thức. Tỷ như,1,2- hoàn mình nhị thuầnĐơn giản nhất mà viết vìOC1CCCCC1O.Lựa chọn bất đồng vị trí đoạn hoàn sẽ sinh ra một cái chi nhánh kết cấu.

Hương thơm hoàn[Biên tập]

Như làBenzenLinh tinhHương thơmHoàn có thể viết thành dưới ba loại hình thức chi nhất:

  1. Có luân phiên đơn kiện cùng song kiệnKhải kho lặcThứcCC=CC=C1
  2. Sử dụng hương thơm kiện ký hiệu:,Tỷ nhưC1:C:C:C:C:C1
  3. Nhất thường thấy chính là, thông qua phân biệt lấy viết thường hình thứcb,c,n,o,pCùngsBiên soạn cấu thành B, C, N, O, P cùng S nguyên tử

Ở cuối cùng một loại dưới tình huống, cho phép chưa chỉ ra hai cái hương thơm nguyên tử chi gian kiện là hương thơm kiện. Bởi vậy,Benzen,PyridinCùngFu-ranCó thể phân biệt dùng SMILESc1ccccc1,n1ccccc1Cùngo1cccc1.

PyrroleTrung phát hiện cùng hydro kiện hợp hương thơm nitro cần thiết tỏ vẻ vì[nH];Bởi vậyMễ tọaDùng SMILES tỏ vẻ pháp viết vìn1c[nH]cc1.

Đương phương tộc nguyên tử lẫn nhau đơn kiện khi, cần thiết minh xác biểu hiện đơn kiện. Tỷ nhưLiên benzenc1ccccc1-c2ccccc2.Đây là yêu cầu đơn kiện ký hiệu-Số ít tình huống chi nhất. ( trên thực tế đại đa số SMILES phần mềm có thể chính xác suy đoán ra hai cái hoàn chi gian kiện không thể là hương thơm, bởi vậy sẽ tiếp thu phi tiêu chuẩn hình thứcc1ccccc1c2ccccc2)

Dùng cho sinh thành quy phạm SMILES Daylight cùng OpenEye thuật toán ở xử lý hương thơm tính phương diện có điều bất đồng.

Đem3- Cyano benzen giáp mêTỏ vẻ vìCOc(c1)cccc1C#N

Chi nhánh[Biên tập]

Chi liên dùng dấu móc miêu tả, nhưBính toanCCC(=O)OCùngFlo phỏngFC(F)F.Dấu móc nội cái thứ nhất nguyên tử cùng dấu móc nội gốc lúc sau cái thứ nhất nguyên tử đều cùng tương đồng chi nhánh điểm nguyên tử kiện hợp. Liên kết hoá học ký hiệu cần thiết xuất hiện ở dấu móc nội, phần ngoài ( tỷ như:CCC=(O)O) không có hiệu quả.

Thay thế được hoàn có thể dùng hoàn trung chi nhánh điểm viết, như mã hóa 3 cùng 4- Cyano benzen giáp mê dị cấu thể SMILESCOc(c1)cccc1C#N(Thấy hình ảnh(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ) cùngCOc(cc1)ccc1C#N(Thấy hình ảnh) sở kỳ. Lấy phương thức này vì thay thế hoàn biên soạn SMILES có thể sử chúng nó càng dễ dàng đọc.

Có thể ấn bất luận cái gì trình tự biên soạn chi nhánh. Tỷ như,Nhị Flo một Clo một xú metanNhưng viết vìFC(Br)(Cl)F,BrC(F)(F)Cl,C(F)(Cl)(F)BrChờ. Thông thường, nếu so đơn giản chi nhánh xuất hiện ở đằng trước, tắc SMILES biểu đơn dễ dàng nhất đọc, cuối cùng chưa thêm dấu móc bộ phận là nhất phức tạp. Loại này một lần nữa sắp hàng duy nhất cảnh cáo là:

  • Nếu hoàn hào bị lặp lại sử dụng, chúng nó đem căn cứ chúng nó ở SMILES tự phù xuyến trung xuất hiện trình tự tiến hành ghép đôi. Khả năng yêu cầu tiến hành một ít điều chỉnh lấy bảo trì chính xác ghép đôi
  • Nếu chỉ định lập thể hóa học, tắc cần thiết tiến hành điều chỉnh

Không cần dấu móc một loại chi nhánh hình thức là bế hoàn kiện. Ở thích hợp vị trí đoạn hoàn có thể giảm bớt dấu móc số lượng. Tỷ như,ToluenThông thường viết thànhCc1ccccc1Hoặcc1ccccc1C,Tránh cho viết thànhc1cc(C)ccc1Hoặcc1cc(ccc1)CKhi sở cần dấu móc.

Lập thể hóa học[Biên tập]

Phản -1,2- nhị Flo Êtilen

SMILES cho phép nhưng không cần cầu đốiLập thể dị cấu thểTiến hành quy phạm.

Song kiện chung quanh phối trí sử dụng tự phù/Cùng\Chỉ định, lấy biểu hiện cùng song kiện liền nhau định hướng đơn kiện. Tỷ như,F/C=C/F(Thấy đồ kỳ(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ) làPhản-1,2- nhị Flo Êtilen một loại tỏ vẻ, trong đó Flo nguyên tử ở vào song kiện tương đối hai sườn ( như đồ sở kỳ ), màF/C=C\F(Thấy đồ kỳ) làThuận-1,2- nhị Flo Êtilen một loại khả năng tỏ vẻ hình thức, trong đó Flo ở vào song kiện cùng sườn.

Kiện phương hướng ký hiệu luôn là cứ thế thiếu hai cái vì một tổ xuất hiện, trong đó cái thứ nhất là tùy ý. Nói cách khác,F\C=C\FCùngF/C=C/FTương đồng. Đương tồn tại luân phiên đơn song kiện khi, gốc lớn hơn hai cái, trung gian phương hướng ký hiệu cùng hai cái song kiện liền nhau. Tỷ như, (2,4)- mình nhị hi thường thấy hình thức viết làmC/C=C/C=C/C(Thấy đồ kỳ(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ).

β- cà rốt tố,Xông ra biểu hiện 11 cái song kiện

Làm một cái càng phức tạp ví dụ,β- cà rốt tốCó một cái rất dài đơn kiện cùng song kiện luân phiên chủ liên, có thể viết thànhCC1CCC/C(C)=C1/C=C/C(C)=C/C=C/C(C)=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C2=C(C)/CCCC2(C)C(Thấy đồ kỳ(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ).

Tay tính thanTrình tự từ@Hoặc@@Chỉ định. Ấn từ tự phù xuyến bên trái đến phía bên phải trình tự lấyTrình tự quy tắcSuy xét bốn cái kiện. Từ cái thứ nhất kiện góc độ nhìn về phía than, mặt khác ba cái là thuận kim đồng hồ@@Hoặc nghịch kim đồng hồ@( bởi vì@Ký hiệu bản thân là nghịch kim đồng hồ xoắn ốc ).

L-Alanin

Tỷ như, suy xétAlanin.Nó SMILES hình thức chi nhất làNC(C)C(=O)O,Càng hoàn chỉnh mà viết vìN[CH](C)C(=O)O.L-Alanin,Càng thường thấy một loạiĐối ánh dị cấu thể,Viết làmN[C@@H](C)C(=O)O(Thấy miêu tả(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ). Từ nitro than kiện xem, hydro (H), nhóm methyl (C) cùng Acid carboxylic muối (C(=O)O) gốc thuận kim đồng hồ xuất hiện.D- Alanin có thể viết thànhN[C@H](C)C(=O)O(Thấy miêu tả(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ).

Tuy rằng ở SMILES ngón giữa định chi nhánh trình tự thông thường cũng không quan trọng, nhưng dưới tình huống như vậy nó rất quan trọng; trao đổi bất luận cái gì hai cái tổ yêu cầu xoay ngược lại tay tính chỉ tiêu. Nếu chi nhánh điên đảo, bởi vậy Alanin viết vìNC(C(=O)O)C,Như vậy phối trí cũng sẽ điên đảo;L-Alanin viết vìN[C@H](C(=O)O)C(Thấy miêu tả(Giao diện lưu trữ sao lưu,Tồn vớiInternet hồ sơ quán) ). Mặt khác phương pháp sáng tác bao gồmC[C@H](N)C(=O)O,OC(=O)[C@@H](N)CCùngOC(=O)[C@H](C)N.

Cái thứ nhất kiện thông thường xuất hiện nơi tay tính nguyên tử cacbon bên trái, nhưng nếu SMILES lấy tay tính than mở đầu, tỷ nhưC(C)(N)C(=O)O,Như vậy sở hữu bốn cái kiện đều là bên phải. Nhưng trước hết xuất hiện ( dưới tình huống như vậy là[CH]Kiện ) bị dùng làm đối dưới ba cái tiến hành bài tự tham khảo:L- Alanin cũng có thể viết làm[C@@H](C)(N)C(=O)O.

SMILES quy phạm bao gồm đối@Ký hiệu kỹ càng tỉ mỉ thuyết minh, lấy chỉ thị càng phức tạp tay tính trung tâm chung quanh lập thể hóa học, tỷ nhưSong tam giác trùy hình phần tử cấu hình.

Chất đồng vị[Biên tập]

Chất đồng vịChỉ định con số tương đương nguyên tử ký hiệu trước số nguyên chất đồng vị chất lượng. Trong đó một cái nguyên tử làThan 14BenzenViết thành[14c]1ccccc1,Deuteri đại Clo phỏngViết thành[2H]C(Cl)(Cl)Cl.

Ví dụ[Biên tập]

Phần tử Kết cấu SMILES
Khí nitơ N≡N N#N
Dị xyanogen toan giáp chỉ (MIC) CH3−N=C=O CN=C=O
Axít đồng (II) Cu2+SO2−
4
[Cu+2].[O-]S(=O)(=O)[O-]
Hương lan tố Molecular structure of vanillin O=Cc1ccc(O)c(OC)c1
COc1cc(C=O)ccc1O
Cởi hắc kích thích tố(C13H16N2O2) Molecular structure of melatonin CC(=O)NCCC1=CNc2c1cc(OC)cc2
CC(=O)NCCc1c[nH]c2ccc(OC)cc12
Mỹ nông ninh G(C17H15N2) Molecular structure of flavopereirin CCc(c1)ccc2[n+]1ccc3c2[nH]c4c3cccc4
CCc1c[n+]2ccc3c4ccccc4[nH]c3c2cc1
Nicotin(C10H14N2) Molecular structure of nicotine CN1CCC[C@H]1c2cccnc2
Đuôi cá tảo độc tố (C17H22O2) Molecular structure of oenanthotoxin CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO
CCC[C@@H](O)CC/C=C/C=C/C#CC#C/C=C/CO
Cúc trừ sâu tốII(C22H28O5) Molecular structure of pyrethrin II CC1=C(C(=O)C[C@@H]1OC(=O)[C@@H]2[C@H](C2(C)C)/C=C(\C)/C(=O)OC)C/C=C\C=C
Hoàng chân khuẩn gây men độc tốB1(C17H12O6) Molecular structure of aflatoxin B1 O1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5
Đường glucose(β-D-Ti lẩm bẩm đường glucose )(C6H12O6) Molecular structure of glucopyranose OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)1
Nham cải trắng tố (C14H16O9) Molecular structure of cuscutine (bergenin) OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H]2[C@@H]1c3c(O)c(OC)c(O)cc3C(=O)O2
CaliforniaVỏ cứng trùngMột loạiTin tức tố (3Z,6R)-3-methyl-6-(prop-1-en-2-yl)deca-3,9-dien-1-yl acetate CC(=O)OCCC(/C)=C\C[C@H](C(C)=C)CCC=C
(2S,5R)-Chalcogran

Vỏ cây bọ cánh cứngPityogenes chalcographus[13]Tin tức tố

(2S,5R)-2-ethyl-1,6-dioxaspiro[4.4]nonane CC[C@H](O1)CC[C@@]12CCCO2
α-Thujone(C10H16O) Molecular structure of thujone CC(C)[C@@]12C[C@@H]1[C@@H](C)C(=O)C2
Lưu án tố( vitamin B1)(C12H17N4OS+) Molecular structure of thiamin OCCc1c(C)[n+](cs1)Cc2cnc(C)nc2N

Vì thuyết minh có vượt qua 9 cái hoàn phần tử, thỉnh suy xét Cephalosporin hắn đinh -1,[14]Một loại cóKinh nghiệm thứcC54H74N2O10Tai thể 13 hoànTi tần,TừẤn Độ DươngNửa động vật dây sốngCephalodiscusgilchristiTrung tách ra tới:

Từ đồ trung nhất bên trái nhóm methyl bắt đầu:

CC(C)(O1)C[C@@H](O)[C@@]1(O2)[C@@H](C)[C@@H]3CC=C4[C@]3(C2)C(=O)C[C@H]5[C@H]4CC[C@@H](C6)[C@]5(C)Cc(n7)c6nc(C[C@@]89(C))c7C[C@@H]8CC[C@@H]%10[C@@H]9C[C@@H](O)[C@@]%11(C)C%10=C[C@H](O%12)[C@]%11(O)[C@H](C)[C@]%12(O%13)[C@H](O)C[C@@]%13(C)CO

Chú ý%Xuất hiện ở 9 trở lên bế hoàn nhãn hướng dẫn tra cứu phía trước; thấy§ hoànMặt trên§ hoàn.

SMILES mặt khác ví dụ[Biên tập]

SMILES ký hiệu ở Daylight Chemical Information Systems cung cấp SMILES lý luận sổ tay trung tiến hành rồi rộng khắp miêu tả, cũng cung cấp rất nhiều thuyết minh tính thí dụ mẫu. Daylight miêu tả thực dụng trình tự vì người dùng cung cấp kiểm tra bọn họ chính mình SMILES thí dụ mẫu phương pháp, hơn nữa là một loại có giá trị giáo dục công cụ.

Phát triển[Biên tập]

SMARTSLà SMILES cơ sở phía trên cải tiến bản.SMARTSTrung gia tăng một chút là, nó cho phép sử dụngThông xứng phùTỏ vẻ nguyên tử cùng liên kết hoá học. Bởi vậy, nó ở hoá chất cơ sở dữ liệu trung rộng khắp dùng cho kết cấu máy tính hóa tìm tòi. Loại này tìm tòi cơ chế là trước thông qua đưa vào SMILES thức trọng cấu công thức hoá học, lại tìm tòi tử đồ cùng hình; mà không phải trực tiếp thông qua SMILES thức đối lập hoàn thành.

USMILES( có khi trở thành nghĩa rộng SMILES ), loại này “Unique SMILES” là ánh nắng hóa học tin tức hệ thống công ty hữu hạn về kết cấu quy phạm biểu đạt. Mặc kệ bên trong nguyên tử mã hóa trình tự như thế nào, thông qua loại này thuật toán tổng có thể được đến về hoá chất quy phạm, vô nghĩa khác, duy nhất miêu tả (Hóa học kết cấu biểu đạt duy nhất tính,Nhưng tham kiếnQuốc tế hoá chất đánh dấu).

SMIRKS là “reaction SMILES” siêu tập cùng “reaction SMARTS” tử tập, là dùng cho chỉ định phản ứng biến hóa tuyến ký hiệu. Phản ứng mở rộng giống nhau ngữ pháp làREACTANT > AGENT > PRODUCT( không mang theo không cách ), trong đó bất luận cái gì tự đoạn có thể lưu không hoặc bỏ thêm vào lấy điểm (.) phân cách nhiều phần tử, cùng với mặt khác ỷ lại với cơ bản ngôn ngữ miêu tả. Nguyên tử còn có thể dùng con số đánh dấu ( tỷ như[C:1]) dùng cho chiếu rọi, tỷ như[15]Ở.[16]

SMILES đối ứng với ly tán phần tử kết cấu. Nhưng mà, rất nhiều tài liệu đều là đại phần tử, chúng nó quá lớn ( hơn nữa thông thường là tùy cơ ), vô pháp phương tiện mà vì này sinh thành SMILES. BigSMILES là SMILES mở rộng, chỉ ở vì đại phần tử cung cấp hữu hiệu tỏ vẻ hệ thống.[17]

Thay đổi[Biên tập]

Có thể sử dụng kết cấu đồ sinh thành (SDG) thuật toán đem SMILES thay đổi hồi 2D tỏ vẻ.[18]SciFinder, ChemDraw đều nhưng thực hiện SMILES cùng kiểu kết cấu lẫn nhau thay đổi.

Mặt khác nhớ pháp cập tương đối[Biên tập]

Mặt khác trứ danh tuyến tính nhớ pháp bao gồmDuy tư uy nghỉ tuyến tính tỏ vẻ thức(WiswesserLineNotation, WLN ), ROSDAL cùng SLN. Gần nhấtQuốc tế thuần túy cùng ứng dụng hóa học liên hợp sẽĐề cửQuốc tế hoá chất đánh dấuLàm tiêu chuẩnCông thức phân tửBiểu đạt thức.

Nhưng mà phổ biến cho rằng, SMILES cùng InChI so sánh với càng có ( đối người tới nói ) nhưng đọc tính; hơn nữa rất nhiều phần mềm đều duy trì SMILES, trong đó không ít phần mềm đều có đồ luận chờ phương diện lý luận cơ sở.

Khác thỉnh tham chiếu[Biên tập]

Phần ngoài liên tiếp[Biên tập]


  1. ^Helson, Harold E. Structure Diagram Generation. Lipkowitz, Kenny B. ( biên ).Reviews in Computational Chemistry.Hoboken, NJ, USA: John Wiley & Sons, Inc. 2007-01-05: 313–398[2022-02-22].ISBN978-0-470-12590-8.doi:10.1002/9780470125908.ch6.( nguyên thủy nội dungLưu trữVới 2022-04-21 ).
  2. ^SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. Journal of Chemical Information and Computer Sciences. February 1988,28(1): 31–6.doi:10.1021/ci00057a005.
  3. ^SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Modeling. May 1989,29(2): 97–101.doi:10.1021/ci00062a008.
  4. ^SMILES. 3. DEPICT. Graphical depiction of chemical structures. Journal of Chemical Information and Modeling. August 1990,30(3): 237–43.doi:10.1021/ci00067a005.
  5. ^https://wayback.archive-it.org/2118/20100925010036/http://64.251.202.97/pubs/asist2002/17-swanson.pdf|chapterurl=Khuyết thiếu tiêu đề (Trợ giúp)(PDF).The Entrance of Informatics into Combinatorial Chemistry.Medford, NJ:Information Today.2004: 205.ISBN978-1-57387-229-4.
  6. ^Acknowledgements on Daylight Tutorial smiles-etc page.1998[24 June2013].( nguyên thủy nội dungLưu trữVới 2022-04-24 ).
  7. ^SMILES: A line notation and computerized interpreter for chemical structures(PDF).Duluth, MN:U.S. EPA,Environmental Research Laboratory-Duluth. 1987[2022-04-18].Report No. EPA/600/M-87/021. ( nguyên thủy nội dungLưu trữ(PDF)Với 2022-04-11 ).
  8. ^SMILES Tutorial: What is SMILES?.U.S. EPA.[2012-09-23].(Nguyên thủy nội dungLưu trữ với 28 March 2008 ).
  9. ^SMILES. 2. Algorithm for generation of unique SMILES notation. Journal of Chemical Information and Modeling. May 1989,29(2): 97–101.doi:10.1021/ci00062a008.
  10. ^https://doi.org/10.1007%2F11530084_13|chapterurl=Khuyết thiếu tiêu đề (Trợ giúp).Assigning Unique Keys to Chemical Compounds for Data Integration: Some Interesting Counter Examples. Lecture Notes in Computer Science3615.Berlin: Springer. 2005: 145–157[2013-02-12].ISBN978-3-540-27967-9.doi:10.1007/11530084_13.
  11. ^NLP-inspired structural pattern recognition in chemical application.. Pattern Recognition Letters. August 2014,45:11–16.doi:10.1016/j.patrec.2014.02.012.
  12. ^Bridging from syntactic to statistical methods: Classification with automatically segmented features from sequences.. Pattern Recognition. November 2015,48(11): 3749–3756.doi:10.1016/j.patcog.2015.05.001.
  13. ^Isolation of pheromone synergists of bark beetle,Pityogenes chalcographus, from complex insect-plant odors by fractionation and subtractive-combination bioassay. Journal of Chemical Ecology. March 1990,16(3): 861–876.PMID 24263601.doi:10.1007/BF01016496.
  14. ^CID 183413.PubChem.[May 12,2012].( nguyên thủy nội dungLưu trữVới 2022-05-25 )( tiếng Anh ).
  15. ^SMIRKS Tutorial.Daylight Chemical Information Systems, Inc.[29 October2018].( nguyên thủy nội dungLưu trữVới 2022-06-15 ).
  16. ^Reaction SMILES and SMIRKS.Daylight Chemical Information Systems, Inc.[29 October2018].( nguyên thủy nội dungLưu trữVới 2022-01-19 ).
  17. ^BigSMILES: A Structurally-Based Line Notation for Describing Macromolecules.ACS Central Science. September 2019,5(9): 1523–1531.PMC 6764162可免费查阅.PMID 31572779.doi:10.1021/acscentsci.9b00476.
  18. ^Reviews in Computational Chemistry13.New York: Wiley-VCH. 1999: 313–398.ISBN978-0-470-12590-8.doi:10.1002/9780470125908.ch6.