AutoModelForCausalLM.from_pretrained
AutoModelForCausalLM.from_pretrained phương pháp là dùng cho từ dự huấn luyện mô hình thêm tái một cái tự trở về ngôn ngữ mô hình mau lẹ phương thức
• model_path - mô hình địa chỉ, nguyên sinh đọc lấy Baichuan có thể, Lora đọc lấy huấn luyện được đến weights hạ địa chỉ
• load_in_8bit - thiết trí vì True khi, dự huấn luyện mô hình quyền trọng tham số sẽ lấy càng thấp độ chặt chẽ [8 vị ] tiến hành tồn trữ, do đó giảm bớt mô hình sở cần nội tồn không gian.
• trust_remote_code - nên tham số chỉ thị hệ thống ở chấp hành viễn trình hoặc phần ngoài số hiệu khi như thế nào xử lý an toàn tính cùng tín nhiệm tính.
• device_map - ở phân bố thức tính toán hoàn cảnh trung, có thể sử dụng “device_map” tham số đem bất đồng nhiệm vụ phân phối cấp bất đồng tính toán tiết điểm hoặc xử lý khí, cũng lợi dụng song hành tính toán tới gia tốc chỉnh thể tính toán quá trình. Nơi này sử dụng auto tự định lựa chọn
fromtransformersimportAutoModelForCausalLM
# từ dự huấn luyện mô hình thêm tái tự trở về ngôn ngữ mô hình
model=AutoModelForCausalLM.from_pretrained(
"gpt2",
cache_dir="/HDD/liuyuanyuan/Pre_model/cache/",# hoãn tồn địa chỉ
from_tf=False,
force_download=False,
resume_download=True,
use_auth_token=False
)
• pretrained_model_name_or_path - chỉ định muốn thêm tái dự huấn luyện mô hình tên hoặc đường nhỏ.
• config - nhưng tuyển tham số, có thể truyền lại một cái dự huấn luyện mô hình phối trí đối tượng ( như GPTConfig ). Nếu không có nói cung, đem tự động từ pretrained_model_name_or_path trung thêm tái.
• cache_dir - nhưng tuyển tham số, dùng cho chỉ định hoãn tồn mục lục địa chỉ.
• from_tf - nhưng tuyển tham số, nếu thiết trí vì True, tắc từ TensorFlow mô hình thay đổi mà đến.
• force_download - nhưng tuyển tham số, nếu thiết trí vì True, tắc cưỡng chế từ mô hình Hub download mô hình.
• resume_download - nhưng tuyển tham số, nếu thiết trí vì True, thì tại download trong quá trình cản phía sau tiếp tục download.
• user_auth_token - nhưng tuyển tham số, nếu thiết trí vì True, hơn nữa ngươi Hugging Face tài khoản đã phối trí token, như vậy đem sử dụng token tiến hành chứng thực.
random.randint
random.sample() hàm số từ một cái danh sách tùy cơ rút ra bao nhiêu cái nguyên tố, đây là trực tiếp từ nguyên tố bản thân trung rút ra. Mà nếu yêu cầu căn cứ danh sách nguyên tố index tới rút ra nguyên tố, tắc có thể dùng random.randint(0,len(some_list)-1), tức tuyển ra muốn rút ra nguyên tố ở nguyên list trung index. Nêu ví dụ như sau:
importrandom
letters=['a','b','c','d','e','f']
random_index=random.randint(0,len(letters)-1)
print(letters[random_index])
# output
e
c
f
a