- 博客(181)
- 资源 (2)
- 收藏
- 关注
原创 Leetcode | 以二叉树,多叉树为主题的理论,真题以及图解【更新中】
前序(preorder traversal):从根节点开始,先访问当前节点,然后递归地遍历左子树,最后递归地遍历右子树。即“根-左-右”的顺序。中序遍历(inorder traversal):从根节点开始,先递归地遍历左子树,然后访问当前节点,最后递归地遍历右子树。即“左-根-右”的顺序。后序遍历(postorder traversal):从根节点开始,先递归地遍历左子树,然后递归地遍历右子树,最后访问当前节点。即“左-右-根”的顺序。
2024-04-26 16:59:18 738 1
原创 CV | 360BEV: Panoramic Semantic Mapping for Indoor Bird‘s-Eye View理解
这篇论文提出了一种名为360BEV的专用解决方案,用于从鸟瞰图像对室内场景进行全景语义映射。提出了一种从全景图像生成整体鸟瞰视图语义映射的方法,不依赖于窄视野图像或运动线索。提出模型360Mapper,可以从全景图像预测语义标签和非模态语义映射。所提出的方法在室内语义映射基准测试中取得了最佳性能,优于现有方法。
2024-04-26 14:00:20 1101 1
原创 LLM | GPT-NEOX论文详解
GPT-NEOX使用旋转位置编码。模型权重使用float16表示。最大序列长度为2048。论文题目:2022.04.14_GPT-NeoX-20B: An Open-Source Autoregressive Language Model。
2024-03-06 13:39:48 1563
原创 问题解决 | RuntimeError: CUDA error: invalid device ordinalCUDA kernel errors
RuntimeError(运行时错误): CUDA 错误:设备序号无效CUDA 内核错误可能会在其他 API 调用中异步报告,因此下面的堆栈跟踪可能不正确。为便于调试,可考虑通过 CUDA_LAUNCH_BLOCKING=1。使用 `TORCH_USE_CUDA_DSA` 进行编译,以启用设备端断言。
2024-03-04 13:41:36 5037
原创 CV | 医学影像上的图像分割模型调研【更新于20240417】
mamba相关的图像分割:VM-Unet,ManbaUnet,BRAUUnet,EGE。
2024-03-04 13:02:04 1705
原创 环境配置 |Jupyter lab/Jupyter Notebook 安装与设置
ipynb使用Jupyterlab/Jupyter Notebook 来编写程序时的文件,在使用时,可以现转换为标准的.py的python文件。
2024-02-29 07:35:57 3238
原创 CV | SAM在医学影像上的模型调研【20240223更新版】
本文主要是SAM(Segment Anything)在医学影像上的数据集,模型及评估方法调研【持续更新】~
2024-02-07 12:14:16 1631
原创 实用篇 | postman在AI模型中输入speech,text,image使用详解
postman在AI模型中输入speech,text,image使用详解
2024-01-30 15:48:35 1444 2
原创 LLM | 一些开源的AI代码生成模型调研及总结【20240130更新】
本文主要介绍主流代码生成模型,总结了基于代码生成的开源大语言模型,按照时间顺序排列。
2024-01-30 09:35:20 2927
原创 RL | 强化学习算法DDPG的理论理解及代码
深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是一种强化学习算法,主要用于解决连续动作空间的问题。
2024-01-24 16:16:25 1102
原创 生成模型 | 2024年新年新论文:audio2photoreal[正在更新中]
本博客主要包含了20240103新出的论文From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations论文解释及项目实现~
2024-01-09 14:49:45 1259
原创 模型量化 | Pytorch的模型量化基础
量化简介量化是指执行计算和存储的技术 位宽低于浮点精度的张量。量化模型 在张量上执行部分或全部操作,精度降低,而不是 全精度(浮点)值。这允许更紧凑的模型表示和 在许多硬件平台上使用高性能矢量化操作。与典型的 FP32 模型相比,PyTorch 支持 INT8 量化,模型大小减少 4 倍内存带宽减少 4 倍INT8 计算的硬件支持通常为 2 到 4 个 与 FP32 计算相比,速度快几倍量化主要是一种技术 加速推理,量化仅支持前向传递 运营商。PyTorch 支持多种量化深度学习模型的方法。
2023-12-27 09:45:22 2222
原创 Linux | 解决问题Ubuntu重启无法进入系统以及网络无法连接【图文详解】
问题解决 | Ubuntu重启无法进入系统记以及网络无法联网问题~
2023-12-26 17:38:50 6854
原创 Docker | 将自己的docker镜像推送到docker hub[图文详情]
本文主要在Docker Hub上上传自己的镜像,可以按照以下图文步骤进行操作~
2023-12-20 15:12:27 4054
原创 生成模型 | 三维重建(3D reconstruction)调研及总结【20231219更新版】
本文是关于三维重建的论文调研,主要集中于基于图片到3d的模型~
2023-12-19 13:47:02 1649
原创 TTS | 2019~2023年最新增强/生成情绪的语音合成调研(20231211更新版)
本博客主要是增强/生成情绪的语音合成调研,论文按照时间顺序排列,
2023-12-11 14:16:32 2752
原创 实用篇 | 3D建模中Blender软件的下载及使用[图文详情]
本文基于数字人系列的3D建模工具Blender软件的安装及使用,还介绍了图片生成3D模型的AI工具~
2023-12-10 14:15:41 3714
原创 生成模型 | 数字人类的三维重建(3D reconstruction)调研及总结【20240222更新版】
本文主要集中于图片到三维重建的算法模型的调研,其中包含人体重建,人脸重建等,博客主要集中于数字人建模的基本方法论文以及算法发展类~ 不定时更新~
2023-12-10 12:08:15 1876
原创 TTS | NaturalSpeech2语音合成论文详解及项目实现
本文主要讲解了微软在2023年4月发表的NaturalSpeech2语音合成论文及项目相关~
2023-12-08 09:58:47 2137 1
原创 赶超GPT-4性能,谷歌最新多模态Gemini发布
Google Gemini 是 Google 正在推出的一套新的生成式 AI 服务,专门针对有兴趣扩展其 AI 服务的企业。它是由 Google DeepMind 项目创建的一系列多模态 AI 模型(我们将在下面详细介绍)。在一份技术报告中,Gemini 表示它超越了现存最强大的基础模型 GPT-4,并表明它不仅在文本生成方面领先,而且在多模态识别和处理方面也处于领先地位。
2023-12-07 12:58:02 966 1
原创 实用篇 | 利用Flask+Postman为深度学习模型进行快速测试(超详细)
利用Flask+Postman为深度学习模型进行快速测试,以及算法中的一些实例,以后会更新一些新的模板~~
2023-12-04 15:48:31 696
语音特征提取详解PPT
2023-04-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人