强化学习DQN

概念及定义 强化学习是一种通过交互的目标导向学习方法,旨在找到连续时间序列的最优策略. 强化学习(Reinforcement learning,RL)讨论的问题是一个主体(agent) 怎么在一个复杂不确定的 环境(environment) 里面去极大化它能获得的奖励。通过感知所处环境的状态(sta

Halo Halo 发布于 2023-10-19

决策树

不纯度 信息不纯度就是指从给定的信息源中获得的信息的纯度或精度。一般用信息熵或者基尼指数来计算。 信息熵(entropy) 信息熵是信息论中的一个概念,用于描述信息的不确定性和随机性。它是由香农在20世纪40年代借鉴了热力学的概念后提出的,可以看作是信息源的不确定性的度量。 H(X)=-\sum_{

Halo Halo 发布于 2023-10-09

3D物体常见属性

Texture(纹理) 泛指物体表面上所呈现的花纹或线条,是物体上呈现的线形纹路 Map(贴图) 把纹理 Texture 的 UV 坐标映射到3D物体表面 Material(材质) 表面的色彩、纹理、光滑度、透明度、反射率、折射率、发光度等表面各可视属性的结合 Mesh(网格) 描述物体的形状,包括

Halo Halo 发布于 2023-09-28

blender基本操作

操作 新建 快捷键:Shift + A,选中需要添加的物体,然后按移动操作方式放置物体 选中 鼠标左击物体,即可选中物体 多选 鼠标左击物体,选中一个物体,然后按住 shift 再左击选中一个物体 左击鼠标,然后拖动形成一个框,框住要选中的物体 全选 快捷键:A 减选 选中多个物体后,按住 shif

Halo Halo 发布于 2023-09-28

多模态

多模态 相较于图像、语音、文本等多媒体(Multi-media)数据划分形式,“模态”是一个更为细粒度的概念,同一媒介下可存在不同的模态。 比如我们可以把两种不同的语言当做是两种模态,甚至在两种不同情况下采集到的数据集,亦可认为是两种模态。 多模态AI 多模态人工智能是一种人工智能,它将多种类型或模

Halo Halo 发布于 2023-09-22

微分和积分

微分方程 微分方程,是指含有未知函数及其导数的关系式。 解微分方程就是找出未知函数。 定义形式 &#

Halo Halo 发布于 2023-08-28

矩阵基本概念

阶 阶是矩阵中的列数, 几阶代表有几种变量,如三个变量x,y,z就是三阶. 阶在代数中就是元,如二元一次方程,用矩阵表示就是二阶. 阶在几Ë

Halo Halo 发布于 2023-08-01

urdf规范简介

起源 URDF全称(United Robotics Description Format)统一机器人描述格式,是一个XML语法框架下用来描述机器人的语言格式. 详细文档参见: https://wiki.ros.org/urdf/XML 单位 长度单位: m 质量单位: kg 速度单位: m/s 层次

Halo Halo 发布于 2023-07-11

大模型 Transformer 简介

由来 Transformer 由论文《Attention is All You Need》提出,目前成熟的大模型系统都是基于 Transforme 流程的取舍实现. Encoder-only(Bert、RoBERTa等)、Decoder-only(GPT系列、LLaMA、OPT、Bloom等)、En

Halo Halo 发布于 2023-07-05

Embedding

Embedding torch.nn.Embedding 是用来将一个数字变成一个指定维度的向量的,比如数字a变成一个10维的向量,数字b变成另外一个10维的向量 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None,

Halo Halo 发布于 2023-07-03