运行 Jupyter Notebook

2024-06-19#Jupyter#Python

通常数据科学家或者工程师会交互式地使用Jupyter Notebook。其实 Jupyter 还提供了在命令行直接运行 Notebook 的能力。详细说明见其文档《Executing notebooks 》

环比与同比

2024-06-12#数据分析

同比与环比是数据分析中的常见指标。新手在新接触它们时,还是需要澄清一些细节的。

让 Docker 使用代理服务器

2024-06-11#Docker

在越来越多的情况下,难以直接使用 docker 命令行构建和运行容器。那么使用代理服务器是一个可选方法。在使用代理时,需要考虑两个场景:

  • Docker 守护进程的代理
  • Docker 容器中的代理

使用 Nginx 搭建 TCP/UDP 负载均衡

2024-06-11#Nginx

Nginx 常常被用于位于应用层的 HTTP 协议的反向代理服务。其实它也可以用于更低层的传输层的代理服务和负载均衡。参见其官方的用户指南 TCP and UDP Load Balancing

阿里云爬坑日志(三):在 Dataworks 数据建模中导入 Hologres 中的表字段

2024-05-30#阿里云#Dataworks#Hologres

在 Dataworks 数据建模功能中,可以通过导入数据库表添加表字段。从功能上看,可以导入 MaxCompute, Hologres 等数据库中的表字段。但实际使用中发现,与 Hologres 的兼容性太差,看起来很美,但实际上是残的,几乎无法使用。阿里云连增加的产品都做不好集成,真不知道产品是为谁服务,难道又是一个面向KPI(或者流行的 OKR)的产品?虽然被恶心了一把,但还得干活吃饭,只好找一些迂回的方法挽救工作效率了。

Linux

2024-05-26#Linux