Chiều sâu cường hóa học tập đã rộng khắp ứng dụng với công nghiệp chế tạo, mô phỏng bắt chước, người máy khống chế, ưu hoá cùng điều hành, trò chơi đánh cờ chờ lĩnh vực. Trong đó, dùng cho thị giác khống chế chiều sâu cường hóa học tập chỉ ở học tập cấp định quan sát hình ảnh tối ưu sách lược, thực hiện đối người máy hành vi khống chế. Nhưng chịu tự thân học tập năng lực chế ước, ở xử lý cao duy trạng thái cùng động tác không gian hạ khống chế vấn đề khi, tồn tại hàng mẫu lợi dụng suất thấp cùng với thuật toán không dễ thu liễm chờ khuyết tật, nghiêm trọng hạn chế chiều sâu cường hóa học tập phương pháp đối người máy vận động khống chế năng lực.

Theo Transformer ở học tập thị giác cùng ngôn ngữ tỏ vẻ phương diện lấy được thật lớn thành công, đem Transformer dẫn vào thị giác khống chế mô hình trung trở thành nghiên cứu nhân viên một loại tân lựa chọn. Ở thị giác khống chế trung, học tập nhưng ở bất đồng khống chế nhiệm vụ gian di chuyển nhưng di chuyển trạng thái tỏ vẻ, đối với tăng lên hàng mẫu lợi dụng suất có quan trọng ý nghĩa. Nhưng mà, đem Transformer nhổ trồng đến thu thập mẫu hiệu suất cao thị giác khống chế vẫn cứ có rất lớn khó khăn.

Vì thế, Hong Kong đại học mục Nghiêu tiến sĩ đám người đưa ra một loại mới mẻ độc đáo khống chế Transformer dàn giáo CtrlFormer. CtrlFormer ở bất đồng khống chế nhiệm vụ chi gian liên hợp học tập thị giác lệnh bài cùng sách lược lệnh bài chi gian tự lực chú ý cơ chế, có thể ở không phát sinh tai nạn tính quên đi dưới tình huống học tập cùng di chuyển nhiều nhiệm vụ tỏ vẻ. Ngoài ra, còn thiết kế một cái đối lập cường hóa học tập phạm thức tới huấn luyện CtrlFormer, làm này có thể đạt tới so cao hàng mẫu hiệu suất.

Ở DMControl tiêu chuẩn cơ bản thí nghiệm trung, gần nhất tiên tiến phương pháp ở sử dụng 100k hàng mẫu di chuyển học tập sau ở “Cartpole” nhiệm vụ trung sinh ra 0 điểm mà thất bại, mà CtrlFormer có thể ở chỉ sử dụng 100k hàng mẫu dưới tình huống đạt được 769±34 tiên tiến nhất điểm, đồng thời bảo trì phía trước nhiệm vụ tính năng.

8 nguyệt 31 ngày vãn 7 điểm,“AI tân thanh niên toạ đàm” đệ 152 giảng mời đến Hong Kong đại học ở đọc tiến sĩ mục Nghiêu tham dự, chủ giảng 《Chiều sâu cường hóa học tập nhiều nhiệm vụ di chuyển và ở người máy thượng ứng dụng》.

Đệ 152 giảng

Chủ đề

Chiều sâu cường hóa học tập nhiều nhiệm vụ di chuyển và ở người máy thượng ứng dụng

Đề cương

1, thị giác khống chế ở người máy trung ứng dụng cùng khiêu chiến
2. Căn cứ vào CtrlFormer chiều sâu cường hóa học tập nhiều nhiệm vụ di chuyển
3, đối lập cường hóa học tập huấn luyện dàn giáo
4, người máy khống chế nhiệm vụ trung thị giác phiếm hóa tính

Giảng giả giới thiệu

Mục Nghiêu, Hong Kong đại học ở đọc tiến sĩ, sư từ La Bình lão sư, hiện chủ yếu nghiên cứu phương hướng bao gồm cường hóa học tập, người máy khống chế cùng tỏ vẻ học tập, ở NeurIPS, ICML, CVPR, IJCAI chờ đỉnh cấp hội nghị phát biểu luận văn 5 thiên, từng hoạch ICCAS 2020 tối ưu học sinh luận văn thưởng, IV2021 tối ưu học sinh luận văn đề danh thưởng.

Chương trình học tin tức

Phát sóng trực tiếp thời gian: 8 nguyệt 31 ngày 19:00
Phát sóng trực tiếp địa điểm: Trí đồ vật công khai khóa tri thức cửa hàng