生产制造中的分析型数据建模

2024-08-11#数据建模#数据模型#制造业

在制造业中,企业通常企业会部署ERP软件,以帮助企业在综合管理、生产计划与调度、物料管理、质量管理、成本控制方面的进行信息集成和流程优化,以提升企业的生产效率、资源利用效率,降低成本,改善产品质量和客户服务,从而增强企业的竞争力和可持续发展能力。

尽管ERP软件在收集到生产过程中的关键数据后,可以进行数据分析和报告,但实际的情况是:一方面ERP软件是为了实现企业流程的信息化而产生的,并不支持复杂和高负载的数据分析;另一方面,很多企业处于实施成本的考虑,可能会采购不同的ERP软件,然后进行集成,而它们产生的数据,散落在了不同的系统之中。因此,为了能够进行跨流程的全局运营分析和优化,势必需要构建跨系统的集成数据平台。

使用 Nebula 搭建点对点的虚拟私有网络

2024-08-06#VPN#内网穿透#Nebula

Nebula 是一款可扩展的叠加网络( Overlay Networking )工具,专注于性能、简洁性和安全性,是一个基于 Noise 协议框架 的相互认证的对等(Peer-to-Peer, P2P)软件定义网络。它使用 UDP 打洞技术,可以在多数防火墙或网络地址转换(NAT)之后建立连接,也就是可以进行内网穿透。通俗来说,Nebula 可以将多台异地的主机组建为一个虚拟网络,使它们互相连通。

在 macOS 上设置网络代理

2024-08-01#macOS

在 macOS 上设置网络代理时,可以打开 Wi-Fi 设置,进入详情页面修改代理。但这毕竟需要点击多次,才能修改。其实也使用命令行工具,在终端完成同样的操作。这样就可以与代理工具配合,搭建更为流畅的工作流。macOS 上的网络配置工具是 networksetup

在不同设备之间共享文件的开源工具:LocalSend

2024-07-28#开源软件#文件共享

在不同的设备(比如手机和电脑)之间共享文件和文本(比如复杂的密钥)时,可以使用即时通信软件或者系统工具。但它们有一些局限性:

  • 速度与安全性:比如使用微信传输文件或者发送消息,但这样会将数据发送到远程服务器,可能速度慢,也可能出现安全问题
  • 跨平台:微信官方并没有 Linux 版本的微信。所以无法在Linux服务器与手机微信之间传输文件和消息;可以使用 AirDrop 这种工具,但非苹果设备无法使用。

那么,能否有一个简单的工具,用于在手机和电脑之间传输文件和消息呢?

使用 Golang 重写文件

2024-07-23#Go

在 Go 语言中进行 IO 操作(比如读写文件)很简单;与其他编程语言一样,当写入文件时,需要指定打开文件的模式。

使用 ESP8266-NodeMCU 和 Tasmota 搭建简单的温度和湿度监视器

2024-07-21#ESP8266#Tasmota#IoT#DHT11

夏天又到了最闷热的时候,体感相当不舒服,因此想看看室内外的温度、湿度的情况。于是找到箱底的硬件,DIY一个温度湿度监视器。

使用 retry-cli 工具重试命令

2024-07-17#cli#TabbyML

通常,在控制台运行命令,如果失败,那么会直接返回非0的退出码。有时候,可能希望在命令失败退出后,还能继续重试,直到运行成功。而 demoray/retry-cli 工具就是一个小巧的实现。

在本地搭建 AI 代码助手 Tabby

2024-07-16#TabbyML#LLM#Copilot

Tabby 是一个开源的AI代码助手,可用于在本地搭建大模型服务。它提供了Web界面,还提供了IDE/编辑器,比如 VS Code插件。Tabby 是用 Rust 编写的,提供了小巧的可执行文件,部署起来非常简单。不过,虽然 Tabby 是开源的,但也是有授权协议的,提供了不同的订阅选项:免费的 Community 授权,以及付费的 Team 和 Enterprise 授权。

机器学习工程的实例化:部署机器学习的推理代码

2024-06-23#机器学习#MLOps

在机器学习项目中,数据科学家在服务器上的 Jupyter Notebook 完成机器学习的模型的搭建,包括读取数据、清洗数据、特征工程、模型训练,最终创建推理代码和模型。这些代码和模型需要被部署到生产环境运行。数据科学家完成的一系列工作可认为是在自己的“沙盒”或者实验环境里离线完成的,与生产环境有很大的差异,还需要考虑更多非功能的因素;而数据科学家没有经过软件工程的训练,编写的代码很可能不是生产就绪(Production Ready)的。因此,需要对数据科学家编写的代码进行工程化的重组和改造,才可以部署到生产环境。

从本地目录中安装 Python 包

2024-06-20#Python

在开发 Python 应用或者完成机器学习任务时,通常使用 pip install -r requirements.txt 安装第三方包。但是,当代码在生产环境中运行前,才去安装依赖包,会产生一些问题。比如安装时间长的问题:从官方PyPI服务器或者国内镜像安装依赖包时,网速不够快。对于一些大型包,尤其是机器学习使用的包,可能耗费几分钟或者几十分钟的时间。

参考应用开发的模式,可以将打包和运行解耦。在部署之前,将代码及其依赖打包成本地文件,在运行期间从本地文件中安装或者提取依赖。