From 1a1cf6d011a29732ff40639f07d90952d01dc5d1 Mon Sep 17 00:00:00 2001 From: lianjun-zhang Date: Mon, 21 Oct 2024 14:45:34 +0800 Subject: [PATCH 1/3] =?UTF-8?q?=E4=BF=AE=E5=A4=8Dreadme?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 1 + 1 file changed, 1 insertion(+) diff --git a/README.md b/README.md index ad7cd6dd..fa029d8f 100644 --- a/README.md +++ b/README.md @@ -9,6 +9,7 @@ - **[版本配套说明](#版本配套说明)**

免责声明

+ - 本代码仓库中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布之前,这些分支不应被用于任何生产环境或依赖关键业务的项目中。请务必仅使用我们的正式发行版本,以确保代码的稳定性和安全性。 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。 - 正式版本请参考:[Ascend Device Plugin正式release版本](https://gitee.com/ascend/ascend-device-plugin/releases) -- Gitee From 2f16e7fe7cfa33116172c4b08e373ad39b2172c4 Mon Sep 17 00:00:00 2001 From: Lianjun Zhang Atlas Date: Mon, 21 Oct 2024 06:50:30 +0000 Subject: [PATCH 2/3] =?UTF-8?q?rc3=20readme=E4=BF=AE=E6=94=B9?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Signed-off-by: Lianjun Zhang Atlas --- README.md | 19 +++++++++---------- 1 file changed, 9 insertions(+), 10 deletions(-) diff --git a/README.md b/README.md index fa029d8f..7379b395 100644 --- a/README.md +++ b/README.md @@ -2,19 +2,18 @@ - **[免责声明](#免责声明)** - **[支持的产品形态](#支持的产品形态)** - **[组件介绍](#组件介绍)** -- **[编译Ascend-Device-Plugin](#编译Ascend-Device-Plugin)** +- **[编译](#编译)** - **[组件安装](#组件安装)** - **[说明](#说明)** - **[版本更新记录](#版本更新记录)** - **[版本配套说明](#版本配套说明)** -

免责声明

- +# 免责声明 - 本代码仓库中包含多个开发分支,这些分支可能包含未完成、实验性或未测试的功能。在正式发布之前,这些分支不应被用于任何生产环境或依赖关键业务的项目中。请务必仅使用我们的正式发行版本,以确保代码的稳定性和安全性。 使用开发分支所导致的任何问题、损失或数据损坏,本项目及其贡献者概不负责。 - 正式版本请参考:[Ascend Device Plugin正式release版本](https://gitee.com/ascend/ascend-device-plugin/releases) -

支持的产品形态

+# 支持的产品形态 - 支持以下产品使用资源监测 - Atlas 训练系列产品 @@ -25,14 +24,14 @@ - Atlas 800I A2 推理服务器 -

组件介绍

+# 组件介绍 设备管理插件拥有以下功能: - 设备发现:支持从昇腾设备驱动中发现设备个数,将其发现的设备个数上报到Kubernetes系统中。支持发现拆分物理设备得到的虚拟设备并上报kubernetes系统。 - 健康检查:支持检测昇腾设备的健康状态,当设备处于不健康状态时,上报到Kubernetes系统中,Kubernetes系统会自动将不健康设备从可用列表中剔除。虚拟设备健康状态由拆分这些虚拟设备的物理设备决定。 - 设备分配:支持在Kubernetes系统中分配昇腾设备;支持NPU设备重调度功能,设备故障后会自动拉起新容器,挂载健康设备,并重建训练任务。 -

编译Ascend-Device-Plugin

+# 编译 1. 通过git拉取源码,并切换master分支,获得ascend-device-plugin。 @@ -80,11 +79,11 @@ 2、边侧场景编译仅生成device-plugin二进制文件 -

组件安装

+# 组件安装 1. 请参考《MindX DL用户指南》(https://www.hiascend.com/software/mindx-dl) - 中的“集群调度用户指南 > 安装部署指导 \> 安装集群调度组件 \> 典型安装场景 \> 集群调度场景”进行。 + 中的“开发文档 \> 基础调度 \> 集群调度 \> 安装 \> 组件安装”进行。 -

说明

+# 说明 1. 当前容器方式部署本组件,本组件的认证鉴权方式为ServiceAccount, 该认证鉴权方式为ServiceAccount的token明文显示,建议用户自行进行安全加强。 @@ -101,7 +100,7 @@ | v5.0.0-RC1 | 2023-04-10 | 配套MindX 5.0.RC1版本 | | v3.0.0 | 2023-02-16 | 首次发布 | -

版本配套说明

+# 版本配套说明 版本配套详情请参考:[版本配套详情](https://www.hiascend.com/developer/download/commercial) -- Gitee From 5a785a3d01c35b2b39956abbc84e123b7c3f87ef Mon Sep 17 00:00:00 2001 From: Lianjun Zhang Atlas Date: Mon, 21 Oct 2024 08:03:55 +0000 Subject: [PATCH 3/3] readme Signed-off-by: Lianjun Zhang Atlas --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 7379b395..004ac423 100644 --- a/README.md +++ b/README.md @@ -87,7 +87,7 @@ 1. 当前容器方式部署本组件,本组件的认证鉴权方式为ServiceAccount, 该认证鉴权方式为ServiceAccount的token明文显示,建议用户自行进行安全加强。 -

版本更新记录

+# 版本更新记录 | 版本 | 发布日期 | 修改说明 | |------------|------------|-------------------| -- Gitee