中间件

强化学习DQN

概念及定义强化学习是一种通过交互的目标导向学习方法，旨在找到连续时间序列的最优策略. 强化学习（Reinforcement learning，RL）讨论的问题是一个主体(agent) 怎么在一个复杂不确定的环境(environment) 里面去极大化它能获得的奖励。通过感知所处环境的状态(sta

Halo 发布于 2023-10-19

中间件

决策树

不纯度信息不纯度就是指从给定的信息源中获得的信息的纯度或精度。一般用信息熵或者基尼指数来计算。信息熵（entropy）信息熵是信息论中的一个概念，用于描述信息的不确定性和随机性。它是由香农在20世纪40年代借鉴了热力学的概念后提出的，可以看作是信息源的不确定性的度量。 H(X)=-\sum_{

Halo 发布于 2023-10-09

中间件

3D物体常见属性

Texture(纹理) 泛指物体表面上所呈现的花纹或线条，是物体上呈现的线形纹路 Map(贴图) 把纹理 Texture 的 UV 坐标映射到3D物体表面 Material(材质) 表面的色彩、纹理、光滑度、透明度、反射率、折射率、发光度等表面各可视属性的结合 Mesh(网格) 描述物体的形状，包括

Halo 发布于 2023-09-28

中间件

blender基本操作

操作新建快捷键：Shift + A，选中需要添加的物体，然后按移动操作方式放置物体选中鼠标左击物体，即可选中物体多选鼠标左击物体，选中一个物体，然后按住 shift 再左击选中一个物体左击鼠标，然后拖动形成一个框，框住要选中的物体全选快捷键：A 减选选中多个物体后，按住 shif

Halo 发布于 2023-09-28

中间件

多模态

多模态相较于图像、语音、文本等多媒体(Multi-media)数据划分形式，“模态”是一个更为细粒度的概念，同一媒介下可存在不同的模态。比如我们可以把两种不同的语言当做是两种模态，甚至在两种不同情况下采集到的数据集，亦可认为是两种模态。多模态AI 多模态人工智能是一种人工智能，它将多种类型或模

Halo 发布于 2023-09-22

中间件

微分和积分

微分方程微分方程，是指含有未知函数及其导数的关系式。解微分方程就是找出未知函数。定义形式 &#

Halo 发布于 2023-08-28

中间件

矩阵基本概念

阶阶是矩阵中的列数, 几阶代表有几种变量,如三个变量x,y,z就是三阶. 阶在代数中就是元,如二元一次方程,用矩阵表示就是二阶. 阶在几Ë

Halo 发布于 2023-08-01

中间件

urdf规范简介

起源 URDF全称（United Robotics Description Format）统一机器人描述格式，是一个XML语法框架下用来描述机器人的语言格式. 详细文档参见: https://wiki.ros.org/urdf/XML 单位长度单位: m 质量单位: kg 速度单位: m/s 层次

Halo 发布于 2023-07-11

中间件

大模型 Transformer 简介

由来 Transformer 由论文《Attention is All You Need》提出，目前成熟的大模型系统都是基于 Transforme 流程的取舍实现. Encoder-only(Bert、RoBERTa等)、Decoder-only(GPT系列、LLaMA、OPT、Bloom等)、En

Halo 发布于 2023-07-05

中间件

Embedding

Embedding torch.nn.Embedding 是用来将一个数字变成一个指定维度的向量的，比如数字a变成一个10维的向量，数字b变成另外一个10维的向量 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None,

Halo 发布于 2023-07-03