OptimaAI-CSDN blog

Nguyên sang LongRAG: Một loại dùng cho bề trên bên dưới hỏi đáp song thị giác kiểm tra tăng cường sinh thành phạm thức

Kết quả cho thấy, tin tức lấy ra khí cùng CoT dẫn đường lọc khí liên hợp sách lược ( E&F ) ở sở hữu số liệu tập thượng đều biểu hiện tốt nhất, lộ rõ đề cao hệ thống tính năng. Này thiên luận văn đưa ra LongRAG, một loại thông dụng, song thị giác, lỗ bổng căn cứ vào LLMs RAG hệ thống phạm thức, dùng cho giải quyết LCQA nhiệm vụ trung toàn cục tin tức cùng sự thật chi tiết phân biệt vấn đề.: E&F lắp ráp ở bất đồng số liệu tập thượng tính di trú phân tích cho thấy, sử dụng vốn nhỏ bản địa mô hình ( như ChatGLM3-6B-32k ) thay thế sang quý tại tuyến API tài nguyên, vẫn có thể lấy được ưu dị tính năng. Trong đó, Ig tỏ vẻ toàn cục tin tức, Id tỏ vẻ sự thật chi tiết, LLM tỏ vẻ LLM mô hình, promptg tỏ vẻ sinh thành khí nhắc nhở khuôn mẫu.

2024-10-25 10:34:20 521

Nguyên sang 【 vô tiêu đề 】

Này thiên luận văn hệ thống nghiên cứu bề trên bên dưới RAG trung trinh thám mở rộng vấn đề, đưa ra DRAG cùng IterDRAG hai loại sách lược, cũng thông qua rộng khắp thực nghiệm nghiệm chứng này hữu hiệu tính. Này thiên luận văn đưa ra hai loại trinh thám mở rộng sách lược: Biểu thị cơ sở RAG ( DRAG ) cùng thay đổi biểu thị cơ sở RAG ( IterDRAG ), dùng cho giải quyết bề trên bên dưới RAG trung trinh thám mở rộng vấn đề. Hệ thống mà nghiên cứu bề trên bên dưới RAG trinh thám mở rộng, vì thế dẫn vào hai loại mở rộng sách lược DRAG cùng IterDRAG, lấy hữu hiệu mà mở rộng trinh thám tính toán.: Thông qua rộng khắp thực nghiệm, tác giả phát hiện RAG tính năng theo hữu hiệu trên dưới văn chiều dài gia tăng mà xấp xỉ tuyến tính tăng trưởng, này một quan hệ được xưng là RAG trinh thám mở rộng định luật.

2024-10-24 10:10:04 671

Nguyên sang 【LLM luận văn ngày càng 】｜ BGE-M3E embedding mô hình

Này thiên luận văn đưa ra M3-Embedding mô hình ở nhiều lời ngôn kiểm tra, vượt ngôn ngữ kiểm tra cùng nhiều lời ngôn trường hồ sơ kiểm tra nhiệm vụ trung biểu hiện xuất sắc, thể hiện rồi xưa nay chưa từng có nhiều công năng tính cùng hiệu suất cao tính. Thưa thớt kiểm tra cùng nhiều vector kiểm tra tiến thêm một bước tăng lên tính năng, cuối cùng tổng hợp kiểm tra phương pháp ( All ) biểu hiện tốt nhất.: Ở MLDR cùng NarrativeQA số liệu tập thượng thực nghiệm kết quả cho thấy, M3-Embedding ở trường hồ sơ kiểm tra nhiệm vụ trung biểu hiện xuất sắc, đặc biệt là thưa thớt kiểm tra phương pháp ( Sparse ) cùng nhiều vector kiểm tra phương pháp ( Multi-vec ).: Tự biết thức chưng cất cùng nhiều giai đoạn huấn luyện tan rã thực nghiệm cho thấy, tự biết thức chưng cất lộ rõ đề cao thưa thớt kiểm tra tính năng, nhiều giai đoạn huấn luyện tắc tiến thêm một bước tăng lên chỉnh thể kiểm tra chất lượng.

2024-10-10 16:15:38 726

Nguyên sang 【LLM luận văn ngày càng 】｜ BGE kinh điển luận văn -CPACK

C-Pack bao gồm C-MTEB, C-MTP cùng BGE, cũng thông qua ưu hoá huấn luyện phương pháp thực hiện lộ rõ tính năng tăng lên. Thông dụng đối lập học tập ở C-MTP ( chưa đánh dấu ) thượng tiến hành, thông qua đối lập thành đôi văn bản cùng này phụ hàng mẫu tiến hành học tập.: C-MTP từ hai bộ phận tạo thành: C-MTP ( chưa đánh dấu ) cùng C-MTP ( đánh dấu ). Tổng thể tới xem, C-MTP ( chưa đánh dấu ) cung cấp đại quy mô vô nhãn số liệu, mà C-MTP ( đánh dấu ) tắc cung cấp cao chất lượng đánh dấu số liệu, hai người cộng đồng dùng cho huấn luyện cùng hơi điều văn bản khảm nhập mô hình. C-MTP ( Chinese Massive Text Pairs ) huấn luyện số liệu tập từ hai bộ phận tạo thành: C-MTP ( chưa đánh dấu ) cùng C-MTP ( đánh dấu ).

2024-10-10 16:11:58 1134

Nguyên sang 【LLM luận văn ngày càng 】| thông qua mệnh lệnh điều chỉnh tiến hành linh hàng mẫu đông đúc kiểm tra vô giám sát văn bản tỏ vẻ học tập

Đầu tiên, thiết kế hai cái mệnh lệnh nhiệm vụ, tức vấn đề sinh thành cùng từ ngữ mấu chốt tổng kết, thông qua nhắc nhở dự huấn luyện LLM sinh thành mỗi cái cấp định ngữ liêu kho hợp thành vấn đề cùng từ ngữ mấu chốt. Sau đó, thu hoạch tân sinh thành hợp thành vấn đề cùng từ ngữ mấu chốt cùng với kho ngữ liệu khảm nhập, cũng đem chúng nó thêm quyền bình quân giá trị làm tăng cường kho ngữ liệu tỏ vẻ.: Cùng mặt khác kho ngữ liệu tỏ vẻ tăng cường phương pháp ( như docTTTTTquery ) so sánh với, bổn văn phương pháp ở khảm nhập cấp bậc thượng tăng cường hiệu quả càng lộ rõ, thả tự mệnh lệnh điều ưu mô hình biểu hiện trội hơn này giám sát tỏ vẻ sinh thành mô hình. Theo mô hình quy mô gia tăng, tính năng cũng được đến tăng lên.: Nghiên cứu bốn loại bất đồng quyền trọng phương pháp, kết quả cho thấy tay động thêm quyền phương pháp trội hơn BERTScore phương pháp, thả mệnh lệnh điều ưu sau mô hình biểu hiện càng tốt.

2024-10-02 16:02:14 627

Nguyên sang 【LLM luận văn ngày càng 】| GRIT như thế nào thống nhất văn bản sinh thành cùng khảm nhập

Cùng mặt khác mở ra mô hình so sánh với, bổn văn sinh thành GRITLM 7B ở đại quy mô văn bản khảm nhập tiêu chuẩn cơ bản (MTEB) lên cây lập tân kỹ thuật trình độ, hơn nữa ở một loạt sinh thành nhiệm vụ thượng trội hơn ngang nhau quy mô sở hữu mô hình. Thông qua tiến thêm một bước mở rộng, GRITLM 8X7B tính năng trội hơn bổn văn nếm thử quá sở hữu mở ra sinh thành ngôn ngữ mô hình, đồng thời vẫn cứ là tốt nhất khảm nhập mô hình chi nhất. Đáng chú ý chính là, chúng ta phát hiện GRIT chỉ xứng đôi sinh thành số liệu hoặc khảm nhập số liệu huấn luyện, bởi vậy chúng ta có thể ở không tổn thất tính năng dưới tình huống thống nhất hai người. Trong đó, f là GRITLM tham số hóa mô hình, τ là độ ấm siêu tham số, σ đối mỗi cái phát ra tiến hành trì hóa sau ứng dụng Cosines tương tự độ, q cùng d phân biệt là tuần tra cùng hồ sơ hàng mẫu.

2024-09-23 12:40:07 899

Nguyên sang 【LLM luận văn ngày càng 】| Nga bộ oa khảm nhập mô hình

Thích ứng tính hình ảnh kiểm tra cũng đạt tới hiệu suất cùng độ chặt chẽ cân nhắc, 16 duy độ làm thô bài, 2048 duy độ làm tinh bài chuẩn xác suất đã cùng trực tiếp sử dụng 2048 duy độ làm bài tự độ chặt chẽ còn cao, nhưng tính toán lượng trên diện rộng giảm nhỏ.: Vì đề cao hiệu suất, MRL chọn dùng quyền trọng trói định kỹ thuật, tức sở hữu tuyến tính phân loại khí quyền trọng tương đồng, do đó giảm bớt nội tồn phí tổn. Mỗi cái khảm nhập trước mấy cái duy độ là một cái tin tức phong phú thấp duy vector, theo duy độ gia tăng, tỏ vẻ dần dần trở nên thô ráp. Bổn văn đem MRL/MRL-E mô hình cùng đơn độc huấn luyện thấp duy biểu chinh ( FF ), SVD phân giải, tử internet [2] phương pháp tiến hành rồi tương đối. 16-32-64-128-256-2048 đối trước 200-100-50-25-10 cái hàng mẫu.

2024-09-22 22:48:46 1299

Nguyên sang 【LLM luận văn ngày càng 】| LLM2Vec bật mí đại hình ngôn ngữ mô hình văn bản khảm nhập tiềm năng

Ở Massive Text Embeddings Benchmark ( MTEB ) thượng, LLM2Vec thay đổi mô hình ở vô giám sát mô hình trung đạt tới tân tốt nhất tính năng, tốt nhất mô hình đạt được vì 56.8. Kết hợp giám sát đối lập học tập sau, Meta-LLaMA-3-8B mô hình ở chỉ sử dụng công khai số liệu huấn luyện mô hình trung đạt tới mới nhất tốt nhất tính năng. Này thiên luận văn đưa ra LLM2Vec, một loại đơn giản vô giám sát phương pháp, có thể đem bất luận cái gì giải mã khí chỉ LLM thay đổi vì thông dụng văn bản mã hóa khí. 3. Thông qua phân tích mô hình ở bất đồng tầng cấp tỏ vẻ biến hóa, phát hiện Mistral-7B mô hình ở không cần bất luận cái gì huấn luyện dưới tình huống liền có thể tốt lắm xử lý song hướng lực chú ý.

2024-09-10 10:08:49 812

Nguyên sang Nhưng lựa chọn nghĩ lại mệnh lệnh hơi điều

Ở Huggingface Open LLM Leaderboard thượng, sRecycled WizardLM 7B mô hình ở bất đồng số liệu lượng hạ biểu hiện đều trội hơn đại đa số hiện có mô hình, cho thấy này số liệu chất lượng cao cấp.: Ở chút ít số liệu cảnh tượng hạ, sRecycled WizardLM 7B mô hình ở chỉ sử dụng không đến 1,000 cái lựa chọn tính số liệu khi, biểu hiện trội hơn đại đa số hiện có 7B mô hình, tiến thêm một bước nghiệm chứng số liệu chất lượng cao cấp. Nơi này IFD điểm cân nhắc cấp định mệnh lệnh x hạ, mô hình sinh thành hưởng ứng y khó khăn. Trong đó, x1 là đổi mới sau mệnh lệnh y1 là nguyên thủy hưởng ứng, res,1,... Là hưởng ứng phản xạ tiêu chuẩn, g là giáo viên mô hình.

2024-09-07 15:36:37 933

Nguyên sang PromptReps: Giải khóa LLM kiểm tra lực lượng

Nên phương pháp thông qua nhắc nhở đại hình ngôn ngữ mô hình ( LLMs ) sinh thành tuần tra cùng hồ sơ tỏ vẻ, dùng cho hữu hiệu hồ sơ kiểm tra. Này thiên luận văn trung tâm cống hiến là đưa ra một loại tân linh hàng mẫu hồ sơ kiểm tra phương pháp, nên phương pháp lợi dụng LLMs nhắc nhở năng lực kiếp sau thành dùng cho kiểm tra dày đặc cùng thưa thớt tỏ vẻ, mà không cần thêm vào huấn luyện.: Ở BEIR số liệu tập thượng, PromptReps ở không sử dụng bất luận cái gì thêm vào huấn luyện dưới tình huống, thông qua nhắc nhở sinh thành dày đặc cùng thưa thớt tỏ vẻ, lấy được cùng huấn luyện có tố LLM khảm nhập phương pháp tương tự hoặc càng cao kiểm tra hiệu quả.: PromptReps là một loại đơn giản mà hữu hiệu phương pháp, nó thông qua nhắc nhở LLMs sinh thành dày đặc cùng thưa thớt tỏ vẻ, dùng cho linh hàng mẫu hồ sơ kiểm tra, không cần bất luận cái gì thêm vào vô giám sát hoặc có giám sát huấn luyện.

2024-09-04 12:46:03 815

Nguyên sang 【LLM đại mô hình luận văn ngày càng 】| QAEA-DR: Một cái dùng cho dày đặc kiểm tra thống nhất văn bản tăng cường dàn giáo

Cụ thể tới nói, định lý III.3 cùng định lý III.4 phân biệt thuyết minh tại lý tưởng điều kiện hạ, sinh thành văn bản vector hoặc là bảo trì hoặc là đề cao kiểm tra quá trình sự chính xác. Cụ thể tới nói, sinh thành văn bản vector ở bảo trì hoặc đề cao mục tiêu văn bản cùng tuần tra vector tương tự độ đồng thời, hạ thấp phi mục tiêu văn bản cùng tuần tra vector tương tự độ.: Định lý III.4 chứng minh rồi đem hỏi đáp đối vector cùng sự kiện vector kết hợp đến văn bản tăng cường dàn giáo trung, so chỉ sử dụng một loại loại hình sinh thành văn bản vector càng có thể hữu hiệu đề cao kiểm tra sự chính xác.: Ở kiểm tra trong quá trình, tuần tra vector ở mở rộng sau vector cơ sở dữ liệu trung tìm kiếm tương tự độ tối cao vector. Sinh thành vector bởi vì tin tức mật độ cao, cùng tuần tra vector tương tự độ cao hơn nguyên thủy văn bản vector, do đó đề cao kiểm tra tính năng.

2024-08-23 10:56:28 1043

Nguyên sang 【LLM đại mô hình luận văn ngày càng 】| cách thức thắng qua nội dung: Công bố đại hình ngôn ngữ mô hình nhắc nhở hiệu ứng

Sau đó đem hai loại thí dụ mẫu kết hợp lên, hình thành một cái hoàn chỉnh thí dụ mẫu tập.: Thiết kế một cái tân tổng thể nhắc nhở khuôn mẫu, ở nhắc nhở khuôn mẫu trung tăng thêm thí dụ mẫu cấp mệnh lệnh, miêu tả kế tiếp thí dụ mẫu có tương tự từ hoặc tương tự cú pháp.: Tính toán bất đồng nhắc nhở bộ phận chi gian lực chú ý quyền trọng, phát hiện LLMs ở xử lý miêu tả tính danh từ khi lực chú ý quyền trọng cũng không nhất định lớn hơn tùy cơ danh từ, cho thấy LLMs khả năng cũng không chân chính quan tâm miêu tả thực tế nội dung. Tổng thượng sở thuật, tổng thể nhắc nhở dàn giáo thông qua này riêng cách thức, có thể càng có hiệu mà dẫn đường LLMs lực chú ý, do đó đề cao này ở các loại NLP nhiệm vụ trung tính năng.: Thông qua tính toán bất đồng nhắc nhở bộ phận lực chú ý quyền trọng, phát hiện LLMs ở xử lý miêu tả khi cũng không quan tâm miêu tả thực tế nội dung, mà càng chú ý nhắc nhở cách thức.

2024-08-21 15:03:29 970

Nguyên sang 【LLM đại mô hình luận văn ngày càng 】| LLMs ở dự huấn luyện cùng hơi điều giai đoạn tính năng biến hóa cùng chúng nó chi gian lẫn nhau quan hệ

Nghiên cứu mục đích: Thăm dò dự huấn luyện cùng hơi điều chi gian quan hệ, đặc biệt là chúng nó là như thế nào cộng đồng ảnh hưởng mô hình cuối cùng tính năng. Nghiên cứu phương pháp: Thông qua ở 18 cái số liệu tập thượng hơi điều nhiều dự huấn luyện mô hình trung gian kiểm tra điểm tới tiến hành thực nghiệm phân tích. Chủ yếu phát hiện liên tục dự huấn luyện có thể ở hơi điều sau lấy một loại không rõ ràng phương thức tăng lên mô hình tính năng. Những lời này ý tứ là, ở đại hình ngôn ngữ mô hình ( LLMs ) dự huấn luyện giai đoạn, cho dù mô hình ở dự huấn luyện trong quá trình đối nào đó nhiệm vụ tính năng tăng lên không rõ ràng, liên tục tiến hành dự huấn luyện vẫn cứ có thể ở kế tiếp hơi điều giai đoạn mang đến tiềm tàng tính năng tăng lên. Nói cách khác,

2024-08-18 14:05:57 887

Nguyên sang 【LLM đại mô hình luận văn ngày càng 】| đại hình ngôn ngữ mô hình dùng cho bắt chước tìm tòi người dùng hành vi

Bởi vì phí tổn hiệu quả và lợi ích cùng nhưng tái hiện tính phương diện ưu thế, người dùng bắt chước đã trở thành tin tức kiểm tra hệ thống mặt hướng người dùng đánh giá một loại có tiền cảnh giải quyết phương án. Nhưng mà, chuẩn xác bắt chước người dùng tìm tòi hành vi từ xa xưa tới nay vẫn luôn là một cái khiêu chiến, bởi vì người dùng ở tìm tòi trung hành vi phi thường phức tạp, cũng đã chịu học tập, trinh thám cùng quy hoạch chờ phức tạp nhận tri quá trình điều khiển. Gần nhất, đại hình ngôn ngữ mô hình ( LLM ) ở bắt chước nhân loại trí năng phương diện triển lãm ra lộ rõ tiềm lực, cũng bị dùng cho xây dựng các loại nhiệm vụ tự chủ đại lý. Nhưng mà, lợi dụng LLM bắt chước tìm tòi hành vi tiềm lực chưa hoàn toàn thăm dò. Ở bổn văn trung, chúng ta giới thiệu một loại căn cứ vào LLM người dùng tìm tòi hành vi bắt chước khí, xưng là USimAgent.

2024-08-16 17:52:45 1023

Nguyên sang Đông đúc kiểm tra quy mô nghệ thuật: Mô hình, số liệu cùng tính năng tinh chuẩn xứng đôi

Scaling Laws đã ở rộng khắp nhiệm vụ trung bị quan sát đến, đặc biệt là ở ngôn ngữ sinh thành trung. Lúc trước nghiên cứu phát hiện, đại hình ngôn ngữ mô hình tính năng cùng mô hình, số liệu tập lớn nhỏ tồn tại nhưng đoán trước hình thức quan hệ. Này có trợ giúp chúng ta hữu hiệu mà thiết kế huấn luyện sách lược, đặc biệt là ở đại quy mô huấn luyện càng ngày càng yêu cầu phong phú tính toán tài nguyên thời điểm. Nhưng mà, ở dày đặc kiểm tra trung, loại này Scaling Laws chưa được đến nguyên vẹn thăm dò. Ở bổn nghiên cứu trung, chúng ta nghiên cứu Scaling như thế nào ảnh hưởng dày đặc kiểm tra mô hình tính năng. Chúng ta sử dụng bất đồng tham số lượng tới thực hiện dày đặc kiểm tra mô hình, cũng sử dụng bất đồng số lượng đánh dấu số liệu tới huấn luyện chúng nó. Bổn văn sử dụng đối lập entropy làm đánh giá chỉ tiêu, cùng ly tán bài tự chỉ tiêu so sánh với, nó là liên tục, bởi vậy có thể.

2024-08-15 21:18:57 973

Nguyên sang 【LLM đại ngôn ngữ mô hình -RAG hệ liệt 】 đệ ⼀ bộ phận | 01

2024-08-14 21:32:07 230

Nguyên sang 【LLM đại ngôn ngữ mô hình - khúc dạo đầu 】LLM nhập môn thực tiễn chỉ nam

"LLM nhập môn thực tiễn chỉ nam" là một cái thông qua số hiệu thực tiễn, vì đại mô hình nhập môn người đọc cung cấp toàn diện thả tương đối thâm nhập đại mô hình kỹ thuật thị giác giáo trình.

2024-08-14 21:24:35 335

Nguyên sang Vì cái gì sử dụng đại mô hình API khi, output token giá cả so input token càng quý?

Tồn tại một cái lý tưởng thao tác cùng số liệu phần trăm ( ops:bytes ratio ), này quyết định mỗi đọc lấy một phần số liệu ( tỷ như FP16/BF16 cách thức ) hẳn là chấp hành FLOPs số lượng.: Đưa vào token cùng phát ra token ở bên trong tồn trung chiếm dụng, tỷ như QKV ( Query, Key, Value ) Ma trận lớn nhỏ, trên cơ bản là tương tự. Nhưng là, phát ra token khả năng chọn dùng KV Cache hình thức, đây là một loại ưu hoá kỹ thuật, dùng cho tồn trữ cùng trọng dụng phía trước tính toán kiện giá trị đối, lấy giảm bớt lặp lại tính toán.: Đối với đưa vào cùng phát ra tương đồng số lượng token, mô hình phù điểm giải toán số lần ( FLOPs ) đại khái tương đồng, ước chừng là 2ND, trong đó N đại biểu mô hình tham số lượng.

2024-08-13 15:13:47 702

Đăng lại Đăng lại: LLM làm Sentence Embedding thông dụng phương án

Gần nhất ở làm RAG tương quan hạng mục, ở làm kiểm tra mô hình thời điểm, bởi vì ta nhu cầu càng thiên hướng với chủ đề kiểm tra thả yêu cầu trọng đại thông dụng tính. Hiện có kiểm tra mô hình bge, m3e chờ càng thiên hướng với ngữ nghĩa xứng đôi, cho dù nhằm vào chủ đề làm mô hình hơi điều cũng không có thực tốt thông dụng tính, không thể thực tốt hoàn thành nhu cầu. Nếm thử trực tiếp sử dụng LLM làm Embedding, chủ yếu tư tưởng là đem đưa vào tăng thêm Prompt( đem đưa vào tổng kết thành một cái từ ), sau đó sử dụng cuối cùng một cái từ cuối cùng một tầng làm toàn bộ đưa vào Embedding. Nơi này tế đọc phía dưới 2 thiên văn chương, cũng ở tiếng Trung chủ đề phân loại số liệu tập thượng tiến hành thí nghiệm ( nơi này sử dụng công khai số liệu tập - khoa đại tin phi trường văn bản phân loại ), lúc sau hy vọng có thể ở hạng mục trung có tương đối tốt ứng dụng.

2024-08-06 14:31:07 82

Nguyên sang Tự chưng cất kỹ thuật ở ngôn ngữ mô hình hơi điều trung nhịp cầu tác dụng

Đại hình ngôn ngữ mô hình ( LLMs ) ở tự nhiên ngôn ngữ xử lý ( NLP ) lĩnh vực lấy được đột phá tính tiến triển, nhưng hơi điều này đó mô hình lấy thích ứng riêng nhiệm vụ khi, thường thường khó có thể cân bằng tính năng cùng bảo trì thông dụng mệnh lệnh tuần hoàn năng lực. Ở bổn văn trung, cho rằng nhiệm vụ số liệu tập cùng LLM chi gian phân bố chênh lệch là nguyên nhân chủ yếu. Luận văn đưa ra tự chưng cất hơi điều ( SDFT ) phương pháp, thông qua mô hình tự thân sinh thành số liệu tập tới chỉ đạo hơi điều, lấy giảm bớt tai nạn tính quên đi ( catastrophic forgetting ) cũng bảo trì mô hình hữu dụng tính cùng an toàn tính. Thực nghiệm kết quả cho thấy SDFT ở nhiều tiêu chuẩn cơ bản thí nghiệm trung hữu hiệu, cùng bình thường hơi điều so sánh với, SDFT tại hạ du nhiệm vụ thượng lấy được có thể so hoặc càng ưu việt tính năng.

2024-08-05 19:08:25 896

Nguyên sang Siêu việt đánh dấu: Hợp thành số liệu dẫn dắt hạ văn bản khảm nhập cải tiến kỹ thuật

Doc2query ( Nogueira đám người, 2019 ), InPars ( Bonifacio đám người, 2022 ) cùng Promptagator ( Dai đám người, 2022 ) sinh thành chưa đánh dấu hồ sơ tổng hợp tuần tra, sau đó đem này dùng cho hồ sơ mở rộng hoặc mô hình huấn luyện. SGPT (Muennighoff, 2022), GTR (Ni et al., 2022b) cùng Udever (Zhang et al., 2023a) bằng kinh nghiệm chứng minh rồi văn bản khảm nhập súc phóng quy luật, nhưng chúng nó tính năng vẫn cứ lạc hậu với E5 (Wang đám người, 2022b ) cùng BGE ( Xiao đám người, 2023 ).

2024-08-04 19:41:51 658

Nguyên sang Số liệu giai điệu cùng thuật toán hài hòa: LLMs hơi điều giao hưởng

Đại hình ngôn ngữ mô hình ( LLMs ) thông qua rộng lượng dự huấn luyện token cùng tham số bày ra ra đa dạng hóa năng lực, đủ số học trinh thám, số hiệu sinh thành cùng mệnh lệnh đi theo chờ. Này đó năng lực có thể thông qua giám sát suy thoái điều ( SFT ) tiến thêm một bước tăng cường. Nghiên cứu giả đưa ra bốn cái nghiên cứu vấn đề, tham thảo mô hình tính năng cùng số liệu lượng, tạo thành tỉ lệ, mô hình lớn nhỏ cùng SFT sách lược chờ nhân tố chi gian liên hệ. Thực nghiệm cho thấy bất đồng năng lực tùy số liệu lượng gia tăng mở rộng tính bất đồng, đại hình mô hình ở tương đồng số liệu lượng hạ thông thường biểu hiện càng tốt ( toán học trinh thám cùng số hiệu sinh thành theo số liệu lượng gia tăng mà không ngừng đề cao, mà giống nhau năng lực ở ước chừng một ngàn cái hàng mẫu sau xu với ổn định ). Số liệu tổ hợp ở hữu hạn số liệu điều kiện hạ có thể tăng cường bất đồng năng lực, nhưng ở số liệu sung túc khi khả năng dẫn tới tính năng xung đột.

2024-07-18 16:20:59 1120

Nguyên sang Xuyên qua văn tự mê cung: Thăm dò ngôn ngữ mô hình làm thế giới bắt chước khí tiềm lực cùng cực hạn

Lĩnh vực: Thế giới mô hình cơ cấu: Arizona đại học chờ nhiều cơ cấu phát biểu: ACL 2024 này thiên luận văn tiêu đề là 《Can Language Models Serve as Text-Based World Simulators?》, các tác giả tham thảo xong xuôi trước ngôn ngữ mô hình ( Language Models, tên gọi tắt LMs ) hay không có thể làm văn bản cơ sở thế giới bắt chước khí sử dụng. Văn bản cơ sở thế giới bắt chước khí là chỉ có thể thông qua văn bản miêu tả tới chính xác đoán trước động tác như thế nào thay đổi bất đồng thế giới trạng thái hệ thống, do đó tránh cho đại lượng tay động mã hóa nhu cầu.

2024-07-13 16:32:31 458

Nguyên sang LLM See, LLM Do

Nghiên cứu bối cảnh: Hợp thành số liệu rộng khắp sử dụng dẫn phát rồi về số liệu sinh thành mô hình như thế nào thông qua chưng cất số liệu ảnh hưởng mặt khác đại hình ngôn ngữ mô hình tân vấn đề. Nghiên cứu nội dung: Bổn văn hệ thống nghiên cứu hợp thành số liệu chỉnh hợp đối mô hình bên trong thành kiến, hiệu chỉnh cùng sinh thành văn bản thuộc tính cập thiên tốt ảnh hưởng. Chủ yếu phát hiện: Mô hình đối nào đó thuộc tính dị thường mẫn cảm, cho dù hợp thành số liệu nhắc nhở thoạt nhìn “Trung tính”. Nghiên cứu vấn đề: Hay không có thể lợi dụng số liệu sinh thành quá trình minh xác dẫn đường mô hình ở thí nghiệm khi cụ bị chúng ta muốn thuộc tính. Đưa ra khái niệm: Đưa ra “Chủ động kế thừa” ( active inheritance ), tức có ý thức mà căn cứ phi vi phân mục tiêu ước thúc hợp thành số liệu.

2024-07-09 16:33:26 704

Nguyên sang Datawhale Al trại hè - căn cứ vào tinh hỏa đại mô hình đàn liêu đối thoại phân nhân vật yếu tố lấy ra khiêu chiến tái (1) baseline giải đọc

Chủ trình tự bộ phận đầu tiên đọc lấy huấn luyện cùng thí nghiệm số liệu, sau đó biến lịch thí nghiệm số liệu cũng thuyên chuyển đại mô hình thu hoạch lấy ra tin tức, kiểm tra cùng bổ toàn JSON cách thức, cuối cùng đem kết quả viết nhập phát ra văn kiện trung. Định nghĩa tinh hỏa nhận tri đại mô hình URL, App ID, APIKey cùng APISecret. Định nghĩa một cái hàm số cùng dị thường loại, dùng cho kiểm tra cùng bổ toàn JSON cách thức, bảo đảm sở hữu tất yếu tự đoạn đều tồn tại thả loại hình chính xác. Định nghĩa một cái hàm số, dùng cho hướng tinh hỏa nhận tri đại mô hình gửi đi tin tức cũng thu hoạch hồi phục. Định nghĩa một cái hàm số, dùng cho từ đại mô hình phát ra tự phù xuyến trung lấy ra json. #ai trại hè #datawhale# trại hè #ai. Dùng cho cùng tinh hỏa nhận tri đại mô hình tiến hành lẫn nhau, định nghĩa một cái dùng cho lấy ra tin tức nhắc nhở khuôn mẫu.

2024-07-02 15:24:09 355

Nguyên sang Ảo giác trinh thám: Tiểu mô hình có đại trí tuệ

Bối cảnh: Đại hình ngôn ngữ mô hình ( LLMs ) ở sinh thành văn bản khi khả năng sẽ xuất hiện ảo giác ( hallucinations ), tức nhìn như hợp lý nhưng trên thực tế không có chuyện thật duy trì nội dung. Này đối với LLMs ở thế giới hiện thực ứng dụng cấu thành khiêu chiến. Hiện có phương pháp: Hiện có nghiên cứu ỷ lại với cường đại bế nguyên LLMs ( như GPT-4 ) tiến hành ảo giác kiểm tra đo lường. HaluAgent: Bổn văn đưa ra HaluAgent dàn giáo cho phép tương đối nhỏ lại LLMs ( tỷ như Baichuan2-Chat 7B ) chủ động lựa chọn thích hợp công cụ tới kiểm tra đo lường nhiều loại loại hình ảo giác, như văn bản, số hiệu cùng toán học biểu đạt thức. Phương pháp.

2024-07-01 13:37:59 1110

Nguyên sang UNIGEN dàn giáo hạ văn bản số liệu tập sáng tạo thuật

Bối cảnh: Đại hình ngôn ngữ mô hình ( như GPT-4 cùng Llama3 ) thông qua sinh thành cao chất lượng hợp thành số liệu, giảm bớt đối sang quý nhân công sinh thành số liệu tập ỷ lại, đối các lĩnh vực sinh ra lộ rõ ảnh hưởng. Khiêu chiến: Hiện có sinh thành dàn giáo ở phiếm hóa tính, nhưng khống tính, đa dạng tính cùng chân thật tính phương diện tồn tại khiêu chiến. Phiếm hóa tính (Generalization): Chỉ số theo sinh thành mô hình có thể sinh ra rộng khắp áp dụng với nhiều loại nhiệm vụ cùng cảnh tượng số liệu. Có cao phiếm hóa tính số liệu tập có thể trợ giúp mô hình học tập đến càng rộng khắp cùng thông dụng đặc thù, do đó ở bất đồng ứng dụng trung biểu hiện càng tốt, giảm bớt đối riêng số liệu phân bố ỷ lại. Nhưng khống tính (Controllability)

2024-06-30 08:47:59 1323

Nguyên sang Bề trên bên dưới mô hình ở tri thức trường cuốn trung đọc chi lữ

LCLMs tiềm lực: Bề trên bên dưới ngôn ngữ mô hình có tiềm lực thông qua nguyên sinh xử lý toàn bộ tin tức kho ngữ liệu tới cách tân chúng ta xử lý nhiệm vụ phương thức. Ưu thế: Sử dụng LCLMs có thể đề cao người dùng hữu hảo tính, giảm bớt đối chuyên nghiệp công cụ tri thức yêu cầu, cung cấp cường tráng đoan đến đoan kiến mô, giảm bớt phức tạp lưu trình trung cấp liên sai lầm, cũng cho phép ở toàn bộ hệ thống trung ứng dụng cao cấp nhắc nhở kỹ thuật. LOFT tiêu chuẩn cơ bản: Dẫn vào LOFT ( Long-Context Frontiers ), một cái nhằm vào yêu cầu dài đến mấy trăm vạn token trên dưới văn thế giới hiện thực nhiệm vụ tiêu chuẩn cơ bản, dùng cho đánh giá LCLMs ở trên dưới văn kiểm tra cùng trinh thám phương diện tính năng. Nghiên cứu phát hiện.

2024-06-29 22:33:39 577

Nguyên sang Gist: Thăm dò ngôn ngữ mô hình hiệu suất cao nhắc nhở áp súc chi đạo

Vấn đề trần thuật: Ngôn ngữ mô hình ( LMs ) nhiều nhiệm vụ năng lực chủ yếu thông qua nhắc nhở ( prompting ) tới thực hiện, nhưng nhắc nhở chiếm dụng quý giá đưa vào trên dưới văn cửa sổ không gian, thả lặp lại mã hóa tương đồng nhắc nhở ở tính toán thượng là thấp hiệu. Hiện có phương pháp: Hơi điều ( finetuning ) cùng chưng cất ( distillation ) phương pháp có thể ở không sử dụng nhắc nhở dưới tình huống chuyên môn hóa ngôn ngữ mô hình, nhưng yêu cầu nhằm vào mỗi cái nhiệm vụ một lần nữa huấn luyện mô hình. Đưa ra giải quyết phương án: Bổn văn đưa ra “gisting” phương pháp, thông qua huấn luyện ngôn ngữ mô hình đem nhắc nhở áp súc thành càng tiểu nhân “gist” lệnh bài tập hợp, này đó lệnh bài có thể bị hoãn tồn cùng trọng dụng, lấy đề cao tính toán hiệu suất. Phương pháp.

2024-06-28 09:29:26 645

Nguyên sang Chủ động thức ngôn ngữ đại lý ở thế giới hiện thực quy hoạch trung tiên tri tính sách lược

Bối cảnh: Đại hình ngôn ngữ mô hình ( LLMs ) phát triển tăng cường ngôn ngữ đại lý ở đa dạng hóa thế giới hiện thực cảnh tượng trung quy hoạch năng lực. Vấn đề: Cứ việc có tiến bộ, nhưng LLMs có lý giải mơ hồ người dùng mệnh lệnh tiến hành trinh thám cùng quyết sách năng lực vẫn còn chờ thăm dò. Tân nhiệm vụ: Đưa ra một loại tên là “Proactive Agent Planning” tân nhiệm vụ, yêu cầu ngôn ngữ đại lý căn cứ vào người dùng - đại lý đối thoại cùng đại lý - hoàn cảnh lẫn nhau đoán trước yêu cầu làm sáng tỏ nhu cầu, thuyên chuyển phần ngoài công cụ thu thập hữu hiệu tin tức, cũng sinh thành kế hoạch lấy thỏa mãn người dùng nhu cầu. Tân tiêu chuẩn cơ bản số liệu tập: Thành lập một cái tân tiêu chuẩn cơ bản số liệu tập “Ask-before-Plan”. Tân dàn giáo.

2024-06-25 18:58:50 725

Nguyên sang Hài hoà tri thức kiểm tra hòa thanh: Thông qua kiểm tra khí tổng thể dàn giáo ưu hoá đại hình ngôn ngữ mô hình nhất trí tính

Luận văn: 《Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models》 kỹ càng tỉ mỉ tham thảo kiểm tra tăng cường hình đại hình ngôn ngữ mô hình ( RALMs ) trung kiểm tra khí ( Retriever ) không nhất trí tính vấn đề, cũng đưa ra một loại giải quyết phương án.

2024-06-24 14:48:00 610

Nguyên sang Rượu Cocktail hiệu ứng: LLM thời đại tin tức kiểm tra tân tiêu chuẩn cơ bản

Người đại cao linh liên hợp hoa vì Noah cùng trung khoa viện tính toán sở đưa ra một cái hoàn toàn mới tin tức kiểm tra ( IR ) tiêu chuẩn cơ bản thí nghiệm ——Cocktail, nó đặc biệt nhằm vào đại hình ngôn ngữ mô hình ( LLM ) sinh thành nội dung ( AIGC ) đối IR hệ thống ảnh hưởng tiến hành rồi đánh giá.

2024-06-24 10:57:57 559

Nguyên sang NV-Embed trọng tố văn bản khảm nhập nghệ thuật

Mục đích: Đề cao đại hình ngôn ngữ mô hình ( LLM ) ở văn bản khảm nhập nhiệm vụ thượng tính năng. Phương pháp: Đưa ra NV-Embed mô hình, bao hàm tân giá cấu cùng huấn luyện quá trình. Kết quả: Sử dụng tiềm tàng lực chú ý tầng cùng hai giai đoạn đối lập mệnh lệnh điều chỉnh phương pháp, ở nhiều tiêu chuẩn cơ bản thí nghiệm thượng lấy được ưu dị thành tích. Khai nguyên: Mô hình đem ở Hugging Face thượng khai nguyên.

2024-06-23 11:17:27 948

Nguyên sang Đa trí có thể thể hợp tác trung tiểu thế giới hiện tượng cùng hợp tác mở rộng pháp tắc

Thanh Hoa cùng bắc bưu nghiên cứu nhân viên đưa ra một loại kiểu mới đa trí có thể thể hợp tác internet ( MACNET ), thông qua sử dụng có hướng vô hoàn đồ ( DAG ) tới tổ chức trí năng thể chi gian hỗ động cùng trinh thám quá trình. Thực nghiệm kết quả cho thấy, MACNET ở bất đồng internet Topology kết cấu hạ đều có thể hữu hiệu mà đề cao trí năng thể chi gian hợp tác năng lực, hơn nữa phát hiện “Tiểu thế giới” hợp tác hiện tượng, tức có tiểu thế giới đặc tính Topology kết cấu có thể mang đến càng ưu việt tính năng. Nghiên cứu giả phát hiện, ở này đó kết cấu trung, có tiểu thế giới đặc tính internet Topology hiện ra càng cao hiệu hợp tác tính năng. 🚀 hợp tác mở rộng pháp tắc phát hiện: Luận văn trung một cái quan trọng phát hiện là hợp tác mở rộng pháp tắc, nó miêu tả theo trí năng thể số lượng gia tăng, giải quyết phương án chất lượng như thế nào tuần hoàn đối số tăng trưởng hình thức.

2024-06-22 10:37:42 358

Nguyên sang RichRAG dàn giáo như thế nào vì phức tạp tuần tra bện phong phú trả lời

Vấn đề trần thuật: Truyền thống kiểm tra tăng cường sinh thành (RAG) mô hình chủ yếu chú ý có rõ ràng người dùng ý đồ cùng ngắn gọn đáp án vấn đề cảnh tượng. Nhưng mà, người dùng thường xuyên đưa ra bao la, mở ra thức tuần tra, này đó tuần tra có đa dạng hóa tử ý đồ, yêu cầu phong phú cùng trường hình thức đáp án tới bao trùm nhiều tương quan phương diện. Phương pháp: Đưa ra một cái tân RAG dàn giáo, tên là RichRAG. Nó bao gồm một cái tử phương diện thăm dò khí tới phân biệt đưa vào vấn đề tiềm tàng tử phương diện, một cái nhiều phương diện kiểm tra khí tới xây dựng cùng này đó tử phương diện tương quan đa dạng vùng thiếu văn minh bộ hồ sơ chờ tuyển trì, cùng với một cái sinh thành thức danh sách trí năng xếp hạng mô khối, dùng cho vì cuối cùng sinh thành khí cung cấp nhất có giá trị hồ sơ. Kết quả.

2024-06-21 14:29:11 1168

Nguyên sang Không chỉ là chê cười, là trí tuệ! Chumor số liệu thăm dò AI hài hước

Trích yếu: Luận văn chỉ ra, trước mắt hài hước số liệu tập cùng đánh giá chủ yếu tập trung ở tiếng Anh thượng, khuyết thiếu đối phi tiếng Anh ngôn ngữ ( như tiếng Trung ) văn hóa rất nhỏ khác nhau hài hước lý giải tài nguyên. Vì bổ khuyết này không còn bạch, tác giả xây dựng Chumor số liệu tập, nên số liệu tập nơi phát ra với Trung Quốc “Nhược trí đi” (RZB). Kết luận: Chumor số liệu tập vì phi tiếng Anh hài hước nghiên cứu cùng đề cao LLMs đối bất đồng văn hóa bối cảnh trinh thám năng lực nghiên cứu cung cấp xúc tiến. Tác giả cùng cơ cấu: Đến từ Michigan đại học, tạp nội cơ mai long đại học cùng Thượng Hải giao thông đại học nghiên cứu nhân viên. Kết quả: Nhân loại giải thích lộ rõ trội hơn LLMs sinh thành giải thích.

2024-06-21 10:35:09 475

Nguyên sang Trong gương AI: Tự mình tri thức đánh giá cùng LLM tự mình phát hiện

Ngoài ra, nghiên cứu còn phát hiện, đương mô hình lực chú ý cơ chế cùng nhân loại tương tự khi, chúng nó ở tự mình tri thức nhiệm vụ thượng biểu hiện sẽ có điều đề cao, nhưng cùng nhân loại so sánh với, LLMs lực chú ý tập trung độ vẫn cứ so thấp. Nghiên cứu đoàn đội thông qua bắt chước phí mạn “Nếu ta không thể sáng tạo nó, ta liền không hiểu nó” nguyên tắc, thiết kế một loạt thí nghiệm, làm mô hình ở sinh thành vấn đề sau lại lần nữa trả lời mấy vấn đề này, lấy này kiểm nghiệm mô hình hay không chân chính lý giải chúng nó sở sáng tạo nội dung. Tổng kết tới nói, này thiên luận văn thông qua tự mình tri thức đánh giá dàn giáo, vì lý giải cùng tăng lên LLMs cùng LMMs năng lực cung cấp tân thị giác cùng phương pháp, công bố mô hình ở tự mình lý giải phương diện không đủ, cũng vì tương lai mô hình ưu hoá cùng đánh giá cung cấp có giá trị giải thích.

2024-06-20 14:13:26 333

Nguyên sang Bổ khuyết tin tức kiểm tra “Lỗ trống “: LLM đánh giá nhân vật

Số liệu ô nhiễm thí nghiệm: Vì bảo đảm LLM đánh giá khí kết quả không phải bởi vì số liệu tiết lộ tạo thành, tác giả sử dụng TREC DL 2023 số liệu tập tiến hành rồi thí nghiệm, kết quả cho thấy LLM có thể độc lập với số liệu tiết lộ chính xác mà đánh giá tương quan tính. Bắt chước thực nghiệm thiết kế: Vì thí nghiệm LLM đánh giá khí hiệu quả, tác giả thông qua tùy cơ xóa bỏ TREC DL số liệu tập trung tương quan tính phán đoán tới sáng tạo bất đồng trình độ "Lỗ trống", sau đó làm LLM đánh giá khí nếm thử bổ khuyết này đó lỗ trống. Vấn đề bối cảnh: Theo số liệu tập quy mô tăng trưởng, truyền thống IR đánh giá phương pháp khó có thể bảo trì sở hữu hồ sơ tương quan tính phán đoán hoàn chỉnh, dẫn tới đánh giá kết quả khả năng tồn tại lệch lạc. Linh hàng mẫu nhắc nhở: Không sử dụng bất luận cái gì lúc trước bình định thí dụ mẫu, trực tiếp làm LLM đánh giá chưa bình định hồ sơ.

2024-06-19 17:46:34 344

Nguyên sang Nhìn lá rụng biết mùa thu đến: Đơn lệnh bài mô thái dung hợp cách tân RAG trên dưới văn áp súc

xRAG thông qua một lần nữa giải thích ở dày đặc kiểm tra trung sử dụng hồ sơ khảm nhập, đem chúng nó làm kiểm tra mô thái đặc thù, cũng vận dụng mô thái dung hợp phương pháp đem này đó khảm nhập vô phùng tổng thể đến ngôn ngữ mô hình tỏ vẻ không gian trung. Ở xRAG trung, duy nhất nhưng huấn luyện lắp ráp là mô thái kiều tiếp khí, mà kiểm tra khí cùng ngôn ngữ mô hình bảo trì bất biến. Thực nghiệm kết quả cho thấy, xRAG ở sáu cái tri thức dày đặc hình nhiệm vụ thượng bình quân đề cao vượt qua 10% tính năng, áp dụng với từ dày đặc 7B mô hình đến 8x7B chuyên gia hỗn hợp phối trí các loại ngôn ngữ mô hình. xRAG không chỉ có lộ rõ trội hơn trước kia trên dưới văn áp súc phương pháp, hơn nữa ở mấy cái số liệu tập thượng cùng chưa áp súc mô hình tính năng tương xứng đôi, đồng thời đem chỉnh thể phù điểm giải toán số lần giảm bớt 3.53 lần.

2024-06-19 17:38:07 599

Rỗng tuếch

TA sáng tạo bookmarkTA chú ý bookmark

TA chú ý người