notebook是什么意思(Notebook神器详解)
数据科学用Jupyter Notebook再合适不过了,代码笔记融为一体,交互式操作方便好用,一直以来都是被大家所认可的神器。最近发现了一个新的Notebook工具,除了基本的功能之外,另外还补充了很多Jupyter Notebook上的一些空缺,这个新的神器就是DeepNote。
DeepNote由一个位于旧金山的小团队开发,它是一种云协作、云硬件,上云的 Notebook 编程环境,可与现有的Jupter兼容,方便部署,并且免费,是新一代的数据科学notebook。这里要说下,因为Jupyter Notebook最先进入大家的视野,使用起来也没毛病,所以让使用者切换是存在一定的成本,除非新工具的功能强大到足以让你去忽略掉这个成本。不过有高级科学研究家已发现DeepNote的使用趋势是在缓慢超越Jupyter的,这个趋势说明它确实得到了认可,并且功能上也解决了一部分人群的痛点。闲篇扯完,下面介绍一下DeepNote的新功能。1、团队协作这个功能我觉得是 DeepNote 最大的卖点了。DeepNote 支持在共享计算环境中无缝合作,也就是说当我们在做一个项目时,团队伙伴如果有了好的想法,可以更加快速地分享,而且是实时同步地看到代码运行状态。实时同步
使用 Jupyter Notebook 的现有的做法是,团队每个人都必须跑完代码保存,然后再通过一些途径传给团队其他人,并且其他人如果想分析或者修改,只能再重新跑一遍,如果数据量很大或者代码很长的话,这样会浪费很多不必要的时间。这个功能就好比石墨文档可支持多人同时在线操作一样,我们不用再像以前分享Excel文件那样,每个人填好后再由最后一个人来汇总,为多人协作提供了极大的便利。但这还没完!接着看下面版本控制下面展示了多人协作中的 版本控制功能,每个人对于代码的反馈版本清晰地看见。
代码Review另外,它还提供了代码review功能,我们可追踪团队成员对模型变现的评论,并且如果我们改动了代码也会同步通知评论者。
此外,DeepNote 还提供了不同的权限等级:查看、执行、编辑、管理以及所有者。举个例子,比如一个项目中,我们和其它合作方联合建模,你分享给对方,但不希望可执行,那么我们就可以分配权限,让自己拥有管理或所有者权限,而对方只有查看权限。再或者在自己的团队中,团队成员是有所有者权限的,可执行代码单位,而审查人员只拥有编辑权限,可提供在线反馈,但无法执行任何单元,只有团队成员持有执行权限。使用场景太多了,可自己脑补。2、模型开发更高效DeepNote 不但在多人协作上有很大优势,在个人单独建模分析时也非常的高效。变量分析可视化特征工程的时候,我们查看变量很不方便。DeepNote提供了强大的变量可视化功能,并且交互式体验非常棒。
代码智能补全这个很多编辑器都有这个功能了,有它使用起来更加智能,比Jupyter Notebook好用些。
DeepNote也有自己的快捷键操作,并且正在开发大屏dashboard展示功能,这样可以打通多人协作,实时在线的大屏展示成果。3、连接云硬盘数据科学中有 80% 的无关数学和统计学。在云计算设置中,这个比例更接近 90%,还有 10% 的时间损失在为笔记本配置正确的算力上。DeepNote 可以为你无缝访问基于云的硬件。「无缝」的意思是你可以在笔记本界面上进行所有设置,除非你的核处于空闲状态,否则它是不会主动关闭的。
4、Python包的管理Python 有出色的包管理系统。DeepNote 意识到了这一点,并在工作路径中附有 requirements.txt 文件。即使这样,也很容易忘记安装一些依赖包。除非导入包时触发错误,否则无法意识到这方面有所疏漏。为此,DeepNote 会主动监控包的导入,并根据你生命的需求,提醒你遗漏的依赖。还有,如果需要的文件不存在,它会猜测该文件是什么。剧透预警:它的猜测一般都是正确的。
5、大量的集成DeepNote 几乎提供了你想要的所有集成。为了使notebook井井有条,你可以从不同连接中选择源码控制库。这可以在创建笔记本和写后台更新时用到。
除了源码控制,DeepNote 笔记本还可以连接云计算数据存储,比如 S3、GCS 以及常用的数据库引擎。
以上就是DeepNote的一些独特特征,很多功能也正在开发,希望它可以越来越好,没准未来会有取代Jupyter Notebook的可能。