生产制造中的分析型数据建模

2024-08-11#数据建模 #数据模型 #制造业

在制造业中，企业通常企业会部署ERP软件，以帮助企业在综合管理、生产计划与调度、物料管理、质量管理、成本控制方面的进行信息集成和流程优化，以提升企业的生产效率、资源利用效率，降低成本，改善产品质量和客户服务，从而增强企业的竞争力和可持续发展能力。

尽管ERP软件在收集到生产过程中的关键数据后，可以进行数据分析和报告，但实际的情况是：一方面ERP软件是为了实现企业流程的信息化而产生的，并不支持复杂和高负载的数据分析；另一方面，很多企业处于实施成本的考虑，可能会采购不同的ERP软件，然后进行集成，而它们产生的数据，散落在了不同的系统之中。因此，为了能够进行跨流程的全局运营分析和优化，势必需要构建跨系统的集成数据平台。

使用 Nebula 搭建点对点的虚拟私有网络

2024-08-06#VPN #内网穿透 #Nebula

Nebula 是一款可扩展的叠加网络（ Overlay Networking ）工具，专注于性能、简洁性和安全性，是一个基于 Noise 协议框架的相互认证的对等（Peer-to-Peer, P2P）软件定义网络。它使用 UDP 打洞技术，可以在多数防火墙或网络地址转换（NAT）之后建立连接，也就是可以进行内网穿透。通俗来说，Nebula 可以将多台异地的主机组建为一个虚拟网络，使它们互相连通。

在 macOS 上设置网络代理

2024-08-01#macOS

在 macOS 上设置网络代理时，可以打开 Wi-Fi 设置，进入详情页面修改代理。但这毕竟需要点击多次，才能修改。其实也使用命令行工具，在终端完成同样的操作。这样就可以与代理工具配合，搭建更为流畅的工作流。macOS 上的网络配置工具是 networksetup。

在不同设备之间共享文件的开源工具：LocalSend

2024-07-28#开源软件 #文件共享

在不同的设备（比如手机和电脑）之间共享文件和文本（比如复杂的密钥）时，可以使用即时通信软件或者系统工具。但它们有一些局限性：

速度与安全性：比如使用微信传输文件或者发送消息，但这样会将数据发送到远程服务器，可能速度慢，也可能出现安全问题
跨平台：微信官方并没有 Linux 版本的微信。所以无法在Linux服务器与手机微信之间传输文件和消息；可以使用 AirDrop 这种工具，但非苹果设备无法使用。

那么，能否有一个简单的工具，用于在手机和电脑之间传输文件和消息呢？

使用 Golang 重写文件

2024-07-23#Go

在 Go 语言中进行 IO 操作（比如读写文件）很简单；与其他编程语言一样，当写入文件时，需要指定打开文件的模式。

使用 ESP8266-NodeMCU 和 Tasmota 搭建简单的温度和湿度监视器

2024-07-21#ESP8266 #Tasmota #IoT #DHT11

夏天又到了最闷热的时候，体感相当不舒服，因此想看看室内外的温度、湿度的情况。于是找到箱底的硬件，DIY一个温度湿度监视器。

使用 retry-cli 工具重试命令

2024-07-17#cli #TabbyML

通常，在控制台运行命令，如果失败，那么会直接返回非0的退出码。有时候，可能希望在命令失败退出后，还能继续重试，直到运行成功。而 demoray/retry-cli 工具就是一个小巧的实现。

在本地搭建 AI 代码助手 Tabby

2024-07-16#TabbyML #LLM #Copilot

Tabby 是一个开源的AI代码助手，可用于在本地搭建大模型服务。它提供了Web界面，还提供了IDE/编辑器，比如 VS Code插件。Tabby 是用 Rust 编写的，提供了小巧的可执行文件，部署起来非常简单。不过，虽然 Tabby 是开源的，但也是有授权协议的，提供了不同的订阅选项：免费的 Community 授权，以及付费的 Team 和 Enterprise 授权。

机器学习工程的实例化：部署机器学习的推理代码

2024-06-23#机器学习 #MLOps

在机器学习项目中，数据科学家在服务器上的 Jupyter Notebook 完成机器学习的模型的搭建，包括读取数据、清洗数据、特征工程、模型训练，最终创建推理代码和模型。这些代码和模型需要被部署到生产环境运行。数据科学家完成的一系列工作可认为是在自己的“沙盒”或者实验环境里离线完成的，与生产环境有很大的差异，还需要考虑更多非功能的因素；而数据科学家没有经过软件工程的训练，编写的代码很可能不是生产就绪（Production Ready）的。因此，需要对数据科学家编写的代码进行工程化的重组和改造，才可以部署到生产环境。

从本地目录中安装 Python 包

2024-06-20#Python

在开发 Python 应用或者完成机器学习任务时，通常使用 pip install -r requirements.txt 安装第三方包。但是，当代码在生产环境中运行前，才去安装依赖包，会产生一些问题。比如安装时间长的问题：从官方PyPI服务器或者国内镜像安装依赖包时，网速不够快。对于一些大型包，尤其是机器学习使用的包，可能耗费几分钟或者几十分钟的时间。

参考应用开发的模式，可以将打包和运行解耦。在部署之前，将代码及其依赖打包成本地文件，在运行期间从本地文件中安装或者提取依赖。