Thu tàng
0Hữu dụng +1
0
Toàn văn sưu tác dẫn kình
Lucene thị apache nhuyễn kiện cơ kim hội jakartaHạng mục tổĐích nhất cá tử hạng mục, thị nhất cáKhai phóng nguyên đại mãĐích toàn vănKiểm tác dẫn kìnhCông cụ bao,Đãn tha bất thị nhất cá hoàn chỉnh đích toàn văn kiểm tác dẫn kình, nhi thị nhất cá toàn văn kiểm tác dẫn kình đích giá cấu, đề cung liễu hoàn chỉnh đích tra tuân dẫn kình hòa tác dẫn dẫn kình, bộ phânVăn bổn phân tíchDẫn kình ( anh văn dữĐức vănLưỡng chủng tây phương ngữ ngôn ). Lucene đích mục đích thị viNhuyễn kiện khai phátNhân viên đề cung nhất cá giản đan dịch dụng đích công cụ bao, dĩ phương tiện đích tại mục tiêu hệ thống trung thật hiện toàn văn kiểm tác đích công năng, hoặc giả thị dĩ thử vi cơ sở kiến lập khởi hoàn chỉnh đích toàn văn kiểm tác dẫn kình.LuceneThị nhất sáo dụng vuToàn văn kiểm tácHòa sưu tầm đích khai nguyênTrình thức khố,DoApache nhuyễn kiện cơ kim hộiChi trì hòa đề cung. Lucene đề cung liễu nhất cá giản đan khước cường đại đíchỨng dụng trình thứcTiếp khẩu, năng cú tốToàn văn tác dẫnHòa sưu tầm. TạiJavaKhai phát hoàn cảnhLí Lucene thị nhất cá thành thục đích miễn phíKhai nguyênCông cụ. Tựu kỳ bổn thân nhi ngôn, Lucene thị đương tiền dĩ cập tối cận kỉ niên tối thụ hoan nghênh đích miễn phí Java tín tức kiểm tácTrình tự khố.Nhân môn kinh thường đề đáo tín tức kiểm tác trình tự khố, tuy nhiên dữ sưu tác dẫn kình hữu quan, đãn bất ứng cai tương tín tức kiểm tác trình tự khố dữSưu tác dẫn kìnhTương hỗn hào.[1]
Trung văn danh
Toàn văn sưu tác dẫn kình
Ngoại văn danh
Lucene
Loại chúc
Sưu tác dẫn kình
Khai phát nhân
Doug Cutting
Khai phát thời gian
2000 niên

Phát triển lịch sử

Bá báo
Biên tập
Lucene tối sơ thị do Doug Cutting khai phát đích, tại SourceForge đích võng trạm thượng đề cung hạ tái. Tại 2001 niên 9 nguyệt tác vi cao chất lượng đích khai nguyên Java sản phẩm gia nhập đáoApache nhuyễn kiện cơ kim hộiĐíchJakartaGia tộc trung. Tùy trứ mỗi cá bản bổn đích phát bố, giá cá hạng mục đắc đáo minh hiển đích tăng cường, dã hấp dẫn liễu canh đa đích dụng hộ hòa khai phát nhân viên. 2004 niên 7 nguyệt, Lucene1.4 bản chính thức phát bố, 10 nguyệt đích 1.4.2 bản bổn tố liễu nhất thứbugTu chính. Biểu 1.1 hiển kỳ liễu Lucene đích phát bố lịch sử.
Bản bổn phát bố nhật kỳ lí trình bi
0.01 2000 niên 3 nguyệt đệ nhất cá khai nguyên bản bổn (SourceForge)
1.0 2000 niên 10 nguyệt
1.01b 2001 niên 7 nguyệt tối hậu đích SourceForge bản bổn
1.2 2002 niên 6 nguyệt đệ nhất cáApacheJakarta bản bổn
1.3 2003 niên 12 nguyệtPhục hợp tác dẫnCách thức,Tra tuân phân tích khíTăng gia, viễn trình sưu tác, token định vị, khả khoách triển đíchAPI
1.4 2004 niên 7 nguyệt Sorting, span queries,termvectors
1.4.1 2004 niên 8 nguyệt bài tự tính năng đích bug tu chính
1.4.2 2004 niên 10 nguyệt IndexSearcher optimization and misc. fixes
1.4.3 2004 niên đông Misc. fixes2.4.1 2009 niên 3 nguyệt 8 nhật phát bố tân bản bổn
2.3.0 2008 niên 1 nguyệt canh tân vi 2.3.0
2.4.0 2008 niên 10 nguyệt canh tân vi 2.4.0
2.4.1 2009 niên 5 nguyệt canh tân vi 2.4.1
2.9.0 2009 niên 9 nguyệt 25 hào canh tân vi 2.9.0
2.9.1 2009 niên 11 nguyệt 6 hào canh tân vi 2.9.1
3.0.0 2009 niên 11 nguyệt 25 hào canh tân vi 3.0.0
3.0.1 2010 niên 2 nguyệt 26 hào canh tân vi 3.0.1
3.0.2 2010 niên 6 nguyệt 18 hào canh tân vi 3.0.2
3.0.3 2010 niên 12 nguyệt 3 hào canh tân vi 3.0.3
3.3.0 2011 niên 7 nguyệt sơ canh tân vi 3.3.0
3.4.0 2011 niên 9 nguyệt 14 nhật canh tân vi 3.4.0
3.5.0 2011 niên 11 nguyệt 26 nhật canh tân vi 3.5.0
3.6.0 2012 niên 4 nguyệt 12 nhật canh tân vi 3.6.0
3.6.1 2012 niên 7 nguyệt 23 nhật canh tân vi 3.6.1
4.0 2012 niên 10 nguyệt 12 nhật canh tân vi 4.0[2]
4.2 2013 niên 3 nguyệt 11 nhật canh tân vi 4.2
4.3.1 2013-06-18 phát bố
4.4 2013 niên 7 nguyệt 23 nhật canh tân đáo 4.4
4.5 2013 niên 10 nguyệt 5 nhật canh tân đáo 4.5
5.0.0 2015 niên 2 nguyệt 20 nhật canh tân đáo 5.0.0

Sang thủy nhân

Bá báo
Biên tập
Lucene['lusen] đích nguyên tác giả thị Doug Cutting, tha thị nhất vị tư thâmToàn văn tác dẫn/ kiểm tác chuyên gia, tằng kinh thị V-TwinSưu tác dẫn kìnhĐích chủ yếu khai phát giả, hậu tạiExciteĐam nhậm cao cấp hệ thốngGiá cấu thiết kế sư,Đương tiền tòng sự vu nhất ta Internet để tằng giá cấu đích nghiên cứu. Tảo tiên phát bố tại tác giả tự kỷ đích bác khách thượng, tha cống hiến xuất Lucene đích mục tiêu thị vi các chủng trung tiểu hìnhỨng dụng trình thứcGia nhập toàn vănKiểm tác công năng.Hậu lai phát bố tại SourceForge, 2001 niên niên để thành vi apache nhuyễn kiện cơ kim hội jakarta đích nhất cá tử hạng mục.

Đặc điểm ưu thế

Bá báo
Biên tập
Lucene
Tác vi nhất cáKhai phóng nguyên đại mãHạng mục, Lucene tòng vấn thế chi hậu, dẫn phát liễu khai phóng nguyên đại mã xã quần đích cự đại phản hưởng, trình tự viên môn bất cận sử dụng tha cấu kiến cụ thể đíchToàn văn kiểm tácỨng dụng, nhi thả tương chi tập thành đáo các chủng hệ thống nhuyễn kiện trung khứ, dĩ cập cấu kiến Web ứng dụng, thậm chí mỗ taThương nghiệp nhuyễn kiệnDã thải dụng liễu Lucene tác vi kỳ nội bộ toàn văn kiểm tácTử hệ thốngĐích hạch tâm. apache nhuyễn kiện cơ kim hội đích võng trạm sử dụng liễu Lucene tác vi toàn văn kiểm tác đích dẫn kình,IBMĐíchKhai nguyên nhuyễn kiệneclipse[9] đích 2.1 bản bổn trung dã thải dụng liễu Lucene tác vi bang trợ tử hệ thống đíchToàn văn tác dẫnDẫn kình, tương ứng đích IBM đích thương nghiệp nhuyễn kiện Web Sphere[10] trung dã thải dụng liễu Lucene. Lucene dĩ kỳ khai phóng nguyên đại mã đích đặc tính, ưu dị đíchTác dẫn kết cấu,Lương hảo đích hệ thống giá cấu hoạch đắc liễu việt lai việt đa đích ứng dụng.
Lucene thị nhất cá cao tính năng, khả thân súc đích tín tức sưu tác (IR) khố. Tha khả dĩ vi nhĩ đíchỨng dụng trình tựThiêm gia tác dẫn hòa sưu tác năng lực. Lucene thị dụng java thật hiện đích, thành thục đíchKhai nguyên hạng mục,Thị trứ danh đích Apache Jakarta đại gia đình đích nhất viên, tịnh thả cơ vu Apache nhuyễn kiện hứa khả [ASF,License]. Đồng dạng, Lucene thị đương tiền phi thường lưu hành đích, miễn phí đích Java tín tức sưu tác (IR) khố.

Đột xuất đích ưu điểm

Lucene tác vi nhất cá toàn vănKiểm tác dẫn kình,Kỳ cụ hữu như hạ đột xuất đích ưu điểm:
( 1 )Tác dẫn văn kiệnCách thức độc lập vu ứng dụng bình đài. Lucene định nghĩa liễu nhất sáo dĩ 8 vị tự tiết vi cơ sở đích tác dẫn văn kiện cách thức, sử đắc kiêm dung hệ thống hoặc giả bất đồng bình đài đích ứng dụng năng cú cộng hưởng kiến lập đích tác dẫn văn kiện.
( 2 ) tại truyện thống toàn văn kiểm tác dẫn kình đíchĐảo bài tác dẫnĐích cơ sở thượng, thật hiện liễu phân khối tác dẫn, năng cú châm đối tân đích văn kiện kiến lập tiểu văn kiện tác dẫn, đề thăng tác dẫn tốc độ. Nhiên hậu thông quá dữ nguyên hữu tác dẫn đích hợp tịnh, đạt đáo ưu hóa đích mục đích.
( 3 ) ưu tú đíchDiện hướng đối tượngĐích hệ thống giá cấu, sử đắc đối vu Lucene khoách triển đích học tập nan độ hàng đê, phương tiện khoách sung tân công năng.
( 4 ) thiết kế liễu độc lập vu ngữ ngôn hòaVăn kiện cách thứcĐíchVăn bổn phân tíchTiếp khẩu,Tác dẫn khíThông quá tiếp thụ Token lưu hoàn thànhTác dẫn văn kiệnĐích sang lập, dụng hộ khoách triển tân đích ngữ ngôn hòa văn kiện cách thức, chỉ nhu yếu thật hiện văn bổn phân tích đích tiếp khẩu.
( 5 ) dĩ kinh mặc nhận thật hiện liễu nhất sáo cường đại đích tra tuân dẫn kình, dụng hộ vô nhu tự kỷ biên tả đại mã tức khả sử hệ thống khả hoạch đắc cường đại đích tra tuân năng lực, Lucene đích tra tuân thật hiện trung mặc nhận thật hiện liễu bố nhĩ thao tác, mô hồ tra tuân ( Fuzzy Search[11] ), phân tổ tra tuân đẳng đẳng.
Diện đối dĩ kinh tồn tại đích thương nghiệp toàn văn kiểm tác dẫn kình, Lucene dã cụ hữu tương đương đích ưu thế.
Thủ tiên, tha đích khai phátNguyên đại mãPhát hành phương thức ( tuân thủ Apache Software License[12] ), tại thử cơ sở thượng trình tự viên bất cận cận khả dĩ sung phân đích lợi dụng Lucene sở đề cung đích cường đại công năng, nhi thả khả dĩ thâm nhập tế trí đích học tập đáo toàn văn kiểm tác dẫn kình chế tác kỹ thuật hòa diện hướng đối tượng biên trình đích thật tiễn, tiến nhi tại thử cơ sở thượng căn cư ứng dụng đích thật tế tình huống biên tả xuất canh hảo đích canh thích hợp đương tiền ứng dụng đích toàn văn kiểm tác dẫn kình. Tại giá nhất điểm thượng,Thương nghiệp nhuyễn kiệnĐích linh hoạt tính viễn viễn bất cập Lucene.
Kỳ thứ, Lucene bỉnh thừa liễuKhai phóng nguyên đại mãNhất quán đích giá cấu ưu lương đích ưu thế, thiết kế liễu nhất cá hợp lý nhi cực cụ khoách sung năng lực đíchDiện hướng đối tượngGiá cấu, trình tự viên khả dĩ tại Lucene đích cơ sở thượng khoách sung các chủng công năng, bỉ như khoách sung trung văn xử lý năng lực, tòng văn bổn khoách sung đáoHTML,PDF[13] đẳng đẳng văn bổn cách thức đích xử lý, biên tả giá ta khoách triển đích công năng bất cận cận bất phục tạp, nhi thả do vu Lucene kháp đương hợp lý đích đối hệ thống thiết bị tố liễu trình tự thượng đích trừu tượng, khoách triển đích công năng dã năng khinh dịch đích đạt đáo khóa bình đài đích năng lực.
Tối hậu, chuyển di đáo apache nhuyễn kiện cơ kim hội hậu, tá trợ vu apache nhuyễn kiện cơ kim hội đíchVõng lạc bình đài,Trình tự viên khả dĩ phương tiện đích hòa khai phát giả, kỳ tha trình tự viên giao lưu, xúc thành tư nguyên đích cộng hưởng, thậm chí trực tiếp hoạch đắc dĩ kinh biên tả hoàn bị đích khoách sung công năng. Tối hậu, tuy nhiên Lucene sử dụng Java ngữ ngôn tả thành, đãn thịKhai phóng nguyên đại mãXã khu đích trình tự viên chính tại bất giải đích tương chi sử dụng các chủng truyện thống ngữ ngôn thật hiện ( lệ như.net framework[14] ), tại tuân thủ Lucene tác dẫn văn kiện cách thức đích cơ sở thượng, sử đắc Lucene năng cú vận hành tại các chủng các dạng đích bình đài thượng,Hệ thống quản lý viênKhả dĩ căn cư đương tiền đích bình đài thích hợp đích ngữ ngôn lai hợp lý đích tuyển trạch.

Tiền đề

lucene hữu 7 cá bao nhu yếu đạo nhập: analysis, document, index, queryParser, search, store, util

Sưu tác

Bá báo
Biên tập
IndexSearcher searcher= new IndexSearcher( "E:/index" );
Query query = new TermQuery(new Term( "title", "lucene" ));// đan cáTự tiếtTra tuân
//Query query = new FuzzyQuery(new Term( "title", "lucene" ));// mô hồ tra tuân
//Query query = new WildcardQuery(new Term( "title", "lu*" ));//Thông phối phùTra tuân? Đại biểu nhất cáTự phù,* đại biểu 0 đáo đa cá tự phù
//BooleanQuery query = new BooleanQuery();// điều kiện tra tuân
//BooleanQuery qson1 = new BooleanQuery();
//Query q1 = new TermQuery(new Term( "title", "lucene" ));
//qson1.add(q1, Occur.MUST);//MUST thị tất tu mãn túc đích
//BooleanQuery qson2 = new BooleanQuery();
//Query q2= new TermQuery(new Term( "sex", "woman" ));
//qson2.add(q2, Occur.MUST_NOT);//MUST_NOT thị tất tu bất mãn túc
//query.add(qson1, Occur.SHOULD);
//query.add(qson2, Occur.SHOULD);//SHOULD đại biểu mãn túc qson1 hoặc giả mãn túc qson2 đô khả dĩ
//PhraseQuery query = new PhraseQuery();// cận cự ly tra tuân
//query.setSlop(5);// cự ly thiết trí vi 5
//query.add(new Term( "title", "lucene" ));
//query.add(new Term( "title", "introduction" ));// tra tuân xuất title trung lucene hòa introduction cự ly bất siêu quá 5 cá tự phù đích kết quả
//Query query = new PrefixQuery(new Term( "title", "lu" ));//WildcardQuery đích lu* nhất dạng
//RangeQuery query = new RangeQuery(new Term( "time", "50" ),new Term( "time", "60" ), true);
//true đại biểu [50,60], false đại biểu (50,60)
Hits hits = searcher.search(query);
for (int i = 0; i < hits.length(); i++) {
Document d = hits.doc(i);
String title= d.get( "title" );
System.out.print(title+ "" );
}
Giá dạng, cơ bổn thượng tựu khả dĩ sử dụng liễu
Chú: Dĩ thượng đại mã vi lucene tảo ta bản bổn đích tả pháp. lucene3.02 đích tả pháp hữu sở cải biến.

Kiến lập tác dẫn

Bá báo
Biên tập
IndexWriter writer = new IndexWriter( "E:/index", new StandardAnalyze(),true,MaxFieldLength.UNLIMITED); //true đại biểu phúc cái nguyên tiên sổ cư, maxFieldLength dụng lai hạn chế Field đích đại tiểu
Document doc = new Document();
doc.add(new Field( "title", "lucene introduction", Field.Store.YES, Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS));
doc.add(new Field( "time", "60", Field.Store.YES, Field.Index.ANALYZED,
Field.TermVector.WITH_POSITIONS_OFFSETS));
writer.addDocument(doc);
writer.optimize(); // ưu hóa
writer.close();