p106 điChú ý:21,935Thiệp:202,050
  • 24Hồi phục dán, cộng1Trang

Loại ChatGPT món đồ chơi mới muốn tới, 50hx sẽ nghênh đón mùa xuân sao?

Chỉ xem lâu chủCất chứaHồi phục

Thanh Hoa khai nguyên, loại ChatGPT mô hình ——ChatGLM tới rồi, nhỏ nhất mô hình chỉ có 60 trăm triệu tham số, nghe nói mô hình chấp hành INT4 lượng hóa về sau 6G hiện tồn đều có thể chạy ( tỏ vẻ hoài nghi, phỏng chừng 8G khởi bước ). Bởi vì lượng hóa về sau chủ yếu dùng số nguyên tính lực, không biết không có thiến số nguyên tính lực 50hx có thể hay không bình thường trinh thám, nếu có thể, kia đến là phát huy đệ nhị xuân cơ hội.


IP thuộc địa: Giang Tô1 lâu2023-03-16 00:37Hồi phục
    glm thoạt nhìn không quá hành a, trên dưới văn phương diện này


    IP thuộc địa: Trung Quốc Hong KongĐến từAndroid bản cài đặt2 lâu2023-03-16 07:40
    Hồi phục
      Tuy rằng hiện tại GLM không nhất định hành, nhưng là tương lai liền khả năng xuất hiện vài tỷ tham số cấp bậc, thỏa mãn a trạch hằng ngày yêu cầu mô hình.


      IP thuộc địa: Giang TôĐến từDi động Tieba3 lâu2023-03-16 08:37
      Thu hồi hồi phục
        int4 lý luận chiếm dụng chỉ có fp32 1/8, fp16 1/4, 60 trăm triệu tham số đổi lại đây chỉ có không đến 3g, đều không phải là không có khả năng


        IP thuộc địa: Hồ BắcĐến từAndroid bản cài đặt5 lâu2023-03-16 09:26
        Hồi phục
          Ở công ty A40 thượng thí nghiệm FP16 cùng INT8 lượng hóa phiên bản ChatGLM-6B, FP16 mô hình đối thoại sau chiếm dụng 14.36G, INT8 nhiều luân nhiệm vụ sau ổn định ở 8.72GB. Buổi tối về nhà thử xem P40 như thế nào, không lo lắng hiện tồn, chủ yếu là lo lắng P40 tốc độ không được.


          IP thuộc địa: Giang TôĐến từDi động Tieba8 lâu2023-03-16 13:22
          Thu hồi hồi phục
            Tham số quá tiểu năng lực sẽ phi thường chịu hạn không có gì ý nghĩa


            IP thuộc địa: Thiên TânĐến từAndroid bản cài đặt9 lâu2023-03-16 15:01
            Hồi phục

              Đồ trung, phía trên là P40 thêm tái chưa lượng hóa FP16 mô hình tốn thời gian, phía dưới là P40 thêm tái INT8 lượng hóa mô hình tốn thời gian, khởi động tốn thời gian bao hàm một lần dự nhiệt. Hỏi cùng cái tục viết chuyện xưa vấn đề,
              Lượng hóa về sau vô luận là khởi động tốc độ ( thật khi lượng hóa thêm tái ) vẫn là hỏi đáp tốc độ đều thật sự quá chậm, phải chờ đợi 1 phân nhiều chung...
              Trên thực tế lượng hóa về sau, A40 mặt trên khởi động tốc độ cùng hỏi đáp tốc độ cũng hảo không đến chạy đi đâu, đồng dạng vấn đề muốn 50 giây.


              IP thuộc địa: Giang Tô10 lâu2023-03-16 23:35
              Thu hồi hồi phục
                Duy trì kỹ thuật dán


                IP thuộc địa: Hắc Long GiangĐến từAndroid bản cài đặt11 lâu2023-03-17 08:19
                Hồi phục
                  Download mô hình lớn nhỏ là 12G, mô hình toàn bộ ấn nửa độ chặt chẽ bảo tồn, cái này hiện tồn chiếm dụng tình huống tới xem nửa độ chặt chẽ phù điểm số cũng là nguyên dạng tồn trữ ở hiện tồn trung.
                  Đi tra xét một chút lượng hóa nguyên lý, hiện giai đoạn INT8 chỉ là một loại tồn trữ phương án, cuối cùng tính toán khi vẫn là muốn dựa trừ lấy một cái phạm vi giá trị thay đổi vì phù điểm số, cho nên phù điểm năng lực tàn phế tạp cũng không thể chạy. Khi nào mô hình thật cơ bản dùng số nguyên tính toán lại nói.


                  IP thuộc địa: Giang TôĐến từDi động Tieba13 lâu2023-03-17 09:25
                  Hồi phục
                    P106 có thể chạy không?


                    IP thuộc địa: Tứ XuyênĐến từAndroid bản cài đặt14 lâu2023-03-19 00:07
                    Thu hồi hồi phục
                      Dùng P40 chạy qua, viết cái tổng kết, hội nghị thông tri gì, văn chương miễn cưỡng còn tính lưu loát, chính là thường xuyên viết một nửa liền không có


                      IP thuộc địa: Thượng HảiĐến từAndroid bản cài đặt16 lâu2023-03-28 14:28
                      Thu hồi hồi phục