实例监控可视化!

大家在云端训练过程中,时常需要关注gpu、cpu以及硬盘的使用状态,以便确认硬件是否充分发挥了最佳效果,也能为训练代码的调整提供一些参考。

按照传统方法,大家一般会使用命令进行查看,比如大家熟悉的nvidia-smi、py3smi等,但对于新手来说,这种方式可能不太友好,而对于老手来说,也不方便动态呈现。

对此,【恒源云Gpushare】特上线了【 实例监控 】的功能,意味着,鼠标轻轻一点,大家即可通过线上页面,迅速了解gpu、cpu以及硬盘的利用率。

如何查看呢?大家开启实例后,在该实例的【 快捷工具 】一列,点击【 实例监控 】。

进入可视化页面后,大家可以看到gpu的型号、卡数、显存、使用率等各项数据,同时,可勾选时间段,进一步查看gpu使用率的动态曲线。

不仅如此,该页面还展现了cpu使用率、内存使用率,以及硬盘下的系统磁盘、数据盘的动态数据。

通过这个新功能,希望对大家的训练能有所帮助呢。

小程序创建工单!

大家在使用【恒源云Gpushare】的过程中,往往会遇到一些问题,比如实例问题、数据问题、费用问题等。

这次版本更新,在官网提交工单的基础上,小程序也增加了工单创建的功能,方便大家在移动端解决问题。

大家进入【恒源云】小程序首页,点击【我的工单】,进入工单页面后,可点击创建按钮,填入问题描述等必填项,即可提交工单。
平台技术同事收到工单后,会第一时间回复,请大家关注工单状态哦。

费用预警优化!

本次更新也优化了【费用预警】的设置,大家进入【控制台】,可在首页右侧看到【费用预警】的板块。

点击【设置】后,可选择开启或者关闭余额预警,并且,支持预警金额阈值的调整,一旦触发,将立即发送提醒。

除此之外,还可以选择提醒的方式,包括邮件、短信、微信等。

平台通过费用预警的优化,希望能减少大家对费用消耗的担忧,更加专注于训练本身。

文章来源 | 恒源云社区原文地址 | 【功能更新】实例监控可视化!大家在云端训练过程中,时常需要关注gpu、cpu以及硬盘的使用状态,以便确认硬件是否充分发挥了最佳效果,也能为训练代码的调整提供一些参考。按照传统方法,大家一般会使用命令进行查看,比如大家熟悉的nvidia-smi、py3smi等,但对于新手来说,这种方式可能不太友好,而对于老手来说,也不方便动态呈现。对此,【恒源云Gpushare】特上线了【实例监控】的功能,意味着,鼠标轻轻一点,大家即可通过线上页面,迅速了解gpu、cpu以及
当系统变得缓慢时,我该如何诊断是谁在占用我的系统资源呢? 别急,今天我们就来一起 看看 ,如何利用 Windows 7 内置的"资源监视器"这一强大工具,来诊断系统资源占用引发的一些问题。 首先,我们来一起认识一下这个叫做"资源监视器"的工具吧。认识完了咱们会在文章最后结合具体案例给大家进行一个实用指导的。 要打开资源监视器,有以下几种方法: 1. 打开任务管理器,切换到"性能"选项...
大噶好啊,今日小编还在坚挺中,没疯,虽然被告知所在区域是封控区,但工作还需要我去完成,我得加油!⛽️ 今天先不搬运小伙伴们的论文类文章,先给各位来个技巧分享! 内容不长,希望能带给各位炼丹小伙伴们一点小小的帮助。 这里是一个简单易用的一个后台全自动化训练日志记录、结果数据自动保存和自动关机的脚本。 仓库地址:https://github.com/Littleor/HY-Auto-Trainer 使用 nohup
文章来源 | 恒源 社区(专注人工智能/深度学习 GPU 服务器训练平台,官方体验网址:https:// gpu share .com/) 原文地址 |https:// gpu share .com/docs/best_practices/spyder/ Spyder是一款免费、开源的跨平台 Python 语言开发环境,提供高级的代码编辑、交互测试、调试等特性。使用其远程连接 功能 使用远程 Python 解析器。 创建好 实例 后打开该 实例 的JuypterLab, 建一个终端。也可以通过 SSH 客户端工具连接到实...
文章来源 | 恒源 社区(专注人工智能/深度学习 GPU 服务器训练平台,十一月宠粉活动 ing,官方体验网址:https:// gpu share .com/ ) 原文地址 | https:// gpu share .com/docs/instance/team/ 经过多期的分享,相信很多小伙伴已经对我们平台的 功能 都有一定的了解了。 那,多人共享 实例 、镜像,数据……这些 功能 你想要吗? 今天,就让小编给大家分享团队如何更好的在我们平台进行快速有效的算法训练吧~ 首先,何为团队? 多个用户可以组建一个团队,一个团队内
最近忙于实验论文,奈何实验室硬件资源不够,只能混迹于各家的 GPU 服务器平台,经过近一段时间以来的摸索,同时根据自己在各家平台的使用体验,向大家分享一下一下 恒源 GPU 服务器的的操作总结,方便大家参考。 如下是使用教程: 下面结合我的使用体验进行详细介绍。 一、配置 实例 1、首先进入官网: 恒源 _ GPU SHARE - 恒源 智享 点击 市场我们可以看到当前提供的的各种显卡类型,可以看到显卡类型包括了NVIDIA的 RTX系列、Tesla系列、GTX系列,还是十分丰富的,而且也提供了低中高三种价位供选 1、如何看显卡占用的情况? 通过终端执行 nvidia-smi 命令可以查看显卡的情况,可以查看显卡功耗、显存占用等情况。 root@I15b96311d0280127d:~# nvidia-smi Mon Jan 11 13:42:18 2021 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 460.27.
文章来源 | 恒源 社区(专注人工智能/深度学习 GPU 服务器训练平台,官方体验网址:https:// gpu share .com/) 原文地址 |https:// gpu share .com/docs/best_practices/tensorboard/ TensorBoard 是用于提供机器学习工作流程期间所需的测量和可视化的工具。 它使您能够跟踪实验指标,例如损失和准确性,可视化模型图,将嵌入物投影到较低维度的空间等等。 创建一个镜像为 TensorFlow 2 的 实例 ,当创建 实例 并启动后,可以在实.