使用 Telegraf 发送数据到阿里云 Lindorm 时序引擎
一个小巧绿色的 HTML 压缩器:minify
minify 是一个用于压缩(minify) HTML 页面的工具,包括了多个压缩器(minifiers)。虽然在网络上已经有很多压缩器了,但这个用Go 语言编写的工具的最大优势是,可执行文件的体积小、无依赖,绿色易用。
《Introducing MLOps》读书笔记:MLOps、ModelOps 与 AIOps,以及 DataOps
MLOps(Machine learning operations)是企业部署数据科学项目的关键组件,它 是将软件工程领域的DevOps实践,应用到机器学习领域。大致上来说,它是一个过程或者一整套体系,帮助组织和商业领袖在构建数据科学、机器学习和人工智能相关应用时,能够减少风险,创造长期价值。在提及 MLOps 时,可能有一些其他术语让人疑惑,比如ModelOps 和 AIOps。
在本地搭建密码管理工具 Vaultwarden
Vaultwarden 是一个开源的密码管理器的服务器,它主要由 Rust 编写,最终编译成一个可执行文件,因此不需要安装其他依赖,非常地小巧绿色,下载可执行文件后,即可运行服务器;然后再搭配客户端程序,就可以管理密码了。
使用 Ollama 在本地运行大语言模型
Ollama 在大语言模型生态中的一个工具,用于在本地运行大语言模型(包括 Llama 2、Mistral、 Gemma等),解决的是 “模型服务” 中的工程化问题。
修复 Kafka Connect 处理超大消息时任务失败的错误
在使用 Kafka Connect构建数据管道时,可能会遇到消息过大而导致任务失败的问题。本文记录排查问题的过程和解决方法。
使用阿里云 Flink 集成 Kafka 数据到 Hologres 中
Hologres 是阿里云提供的实时数据仓库引擎,将业务数据库同步到Hologre后,可构建实时的分析型应用。本文介绍一种数据管道的实现,将数据同步到Hologres中;同时介绍了潜在的漏洞和解决方案。
工业互联网的数据开发实践(一):设备数据的采集
在生产制造中,通常会有两类的系统:IT系统(信息技术系统,即处理数据的硬件和软件的系统)和OT系统(运营技术技术,即控制物理设备运行的系统)。IT系统包含客户管理、产品设计、生产计划、采购、物流、仓储、生产执行、设备管理、财务、人员等信息系统(也可以说是广义的ERP)。而OT系统主要指管理生产车间的硬件和软件,包括PLC、SCADA、网关、机器人等等,这些系统用于控制设备,同时记录生产过程中的设备状态、事件等数据,比如某个设备某个部位的温度变化、开关机状态等。
最近时髦的话语是“工业互联网”。网络上对工业互联网有诸多抽象的定义,比如“工业互联网涵盖了工业物联网的技术部分,工业互联网是要实现人、机、物的全面互联,追求的是业务数字化;而工业物联网强调的是物与物的连接,追求的是生产自动化”。
使用 Git diff 获取细粒度的代码变更
通过 git diff
可以得到当前工作区的代码与代码库中的代码的差异。在一些自动化的任务中,可能期望有更细粒度的差异输出。比如,过滤不同类型的变更文件,过滤不同类型的变更行。