- 相关博文
- 最新资讯
-
Alluxio 是世界上第一个面向基于云的数据分析和人工智能的开源的数据编排技术。 它为数据驱动型应用和存储系统构建了桥梁, 将数据从存储层移动到距离数据驱动型应用更近的位置从而能够更容易被访问。 这还使得应用程序能够通过一个公共接口连接到许多存储系统。 Alluxio内存至上的层次化架构使得数据的访问速度能比现有方案快几个数量级。
-
本文介绍了如何将Vertex AI与Elasticsearch集成来创建RAG应用。主要内容包括:1)配置Gemini模型并在Kibana Playground中使用;2)创建GCP服务账号并设置权限;3)部署Elasticsearch集群;4)创建AI Connector连接Vertex AI;5)上传测试数据并生成嵌入向量;6)在Playground中测试RAG功能,实现基于索引数据的问答。文章重点展示了使用gemini-2.5-flash-lite模型的完整流程,说明了Elasticsearch 9.
-
本文针对电商推荐系统的用户 / 商品冷启动问题,提出 Java 大数据 + 机器学习的解决方案。通过 Flink/Spark 补全用户(地域 / 设备等)与商品(文本 / 图片等)特征,结合 FM、GraphSAGE 等模型搭建关联,再用实时迭代策略动态调优。实战案例显示,该方案使新用户 CTR 从 2.1% 提至 5.8%,新商品首单时间从 7 天缩至 36 小时,为冷启动优化提供可复用技术路径。
-
Docker是一个开源的容器化平台,通过将应用程序及其依赖打包成轻量级容器,实现一次构建,到处运行。相比传统虚拟机,Docker容器启动更快(秒级)、资源占用更少(MB级),支持单个宿主机运行数百个容器。文章详细介绍了Docker的核心命令,包括镜像管理(pull/build/push)、容器操作(run/start/stop)、资源限制和网络配置等,并提供了Kafka等应用容器的示例部署方法。Docker已成为开发测试、微服务架构和云原生应用的核心工具。
-
SpringBoot 整合 Easy-Es 实战操作详解
-
本项目客户端使用Qt6.7.3+cmake进行搭建,需要在项目开始时选择git同步项目,具体环境如下图:没显示的就是不需要勾选的。需要跟随文章进行项目推进的话推荐与文章环境一致。相比于我们之前所实现的仿QQ音乐播放器,这个项目难度要比前者大的多。而且前项目qt5中与qt6中的使用过的函数如果功能没有发生太大变化,我们会省略的去介绍这些功能。希望读者最好是将音乐播放器的项目做完之后再来学习本项目。
-
Paimon——官网阅读:非主键表
-
上海斯歌围绕企业数字化转型的核心痛点,打造了兼具“BPM+AI、低代码、国产化、云原生”四大核心的产品矩阵,其中AI助手“小歌”,可精准识别自然语言、语音及各类附件,协助用户快速完成表单生成、流程绘制、代码编写、规则制定、流程智能审批与发起等工作,重构“对话即办公”的高效场景。截至目前,上海斯歌已累计服务超 750 家大型企业,直接赋能用户突破500万,业务版图覆盖制造、能源、化工、地产、汽车、医药、IT 互联网等20余个主流行业,在不同行业的复杂业务场景中,沉淀了丰富的实践经验。
-
Elasticsearch基础入门-微服务原理以及基础的增删改查
-
Flink 的窗口模型支持通过 Evictor 在窗口计算前后删除元素,提供了更灵活的数据处理能力。Evictor 接口包含 evictBefore 和 evictAfter 方法,分别用于窗口函数调用前后的元素剔除。Flink 内置了三种 Evictor:CountEvictor(保留指定数量元素)、DeltaEvictor 和 TimeEvictor。以 CountEvictor 为例,其通过迭代器从窗口头部删除多余元素,可通过参数控制在窗口函数前后执行剔除。示例代码展示了如何结合事件时间滚动窗口
-
本文介绍了一个自动化同步Git仓库到Gitee的Shell脚本。该脚本主要功能包括:1)批量同步多个仓库;2)支持自定义目标仓库名称;3)可选择保留或清除提交记录;4)支持保留或忽略分支;5)自动生成SSH公钥。使用前需配置源仓库信息、Gitee令牌和组织名,通过REPO_MAPPINGS数组设置仓库映射关系。脚本会处理仓库命名规范,通过API创建Gitee仓库,并提供交互选项决定是否保留历史记录。执行后自动清理临时文件,适合服务器迁移时批量同步Git仓库。
-
YOLOv8无人机目标检测跟踪识别系统 深度学习 PySide界面设计 大数据 毕业设计✅
-
中间件考察重点围绕核心原理(如Redis数据结构、Kafka分区)、高可用设计(集群、副本)、实际问题解决(缓存击穿、消息积压)。建议结合场景理解技术选型差异,例如Redis适合高速读写,Kafka侧重高吞吐日志流,RabbitMQ强调灵活路由。
-
元宇宙作为企业数字化转型的下一站,正在重构商业场景——从沉浸式数字人客服到实时数字孪生工厂,从VR协同设计到虚拟展会,AI模型是元宇宙的“大脑”,支撑着所有智能交互与决策。但元宇宙的特殊性低延迟要求:虚拟环境中的交互(如数字人对话、VR手势识别)需要端到端延迟<100ms,传统集中式部署(如云端统一推理)无法满足;高并发压力:百万级用户同时访问(如虚拟演唱会、线上展会),要求AI服务能应对每秒10万+次请求;实时交互需求:元宇宙中的“活数据”(如用户实时动作、环境动态变化)需要AI模型流式推理。
-
与使用方(设计团队、业主)确认核心功能:能耗数据实时采集(每5分钟一次)、设备运行参数监控(如空调、照明)、能耗趋势可视化(日/月/年报表)、异常告警(如能耗突增)。Redis:主从+哨兵架构(3个哨兵节点),主节点缓存实时能耗数据(过期时间5分钟),从节点备份,哨兵实现主从自动切换(故障转移时间<30s)。开发响应式前端(Vue 框架),支持PC端(大屏展示)与移动端(随时查看),通过 Nginx 部署静态资源,TomCat动态解析。高可用集群部署(VRRP+Keepalived+HAproxy)
-
基于hadoop的豆瓣电影分析与推荐可视化系统
-
Docker部署单节点Kafka与KafkaMap可视化界面实践 摘要:本文详细介绍了使用Docker部署无ZooKeeper的单节点Kafka(3.8.0版本)及KafkaMap可视化界面的完整过程。重点说明:1)Kafka自3.5版本起弃用ZooKeeper,推荐使用KRaft模式;2)提供完整的Docker运行命令及参数详解,包括网络配置、端口映射、KRaft模式特有参数等;3)部署KafkaMap实现可视化监控;4)强调生产环境与测试环境的配置差异。通过容器化部署方案,可快速搭建Kafka开发测试环
-
本文介绍了如何安装和配置Elasticsearch MCP Server,实现通过自然语言与Elasticsearch交互。主要内容包括:安装Elasticsearch和Kibana 9.1.2版本;获取API key;安装Claude Desktop客户端;通过Docker部署MCP服务器,支持stdio协议和环境变量配置;设置Claude Desktop连接MCP服务器;最后展示了使用自然语言查询航班索引数据的示例,验证了MCP服务器的功能。该方案简化了Elasticsearch查询,无需编写复杂的DS
-
NVIDIA驱动初始化流程涉及两个关键函数:nvidia_init_module和nvkms_init。nvidia_init_module是驱动加载总入口,负责初始化内存调试、procfs节点、GPU设备探测、PCI驱动加载、字符设备注册等核心功能,采用分层错误处理机制确保资源正确释放。nvkms_init专门初始化Kernel Mode Setting子系统,包括资源管理器分配、内核线程队列创建、定时器初始化、字符设备注册和配置文件读取,同样配备完善的错误处理流程。两个函数都包含详细的日志输出和错误检查

-
-
-
-
-
王坚博士曾经做过这样一个非常形象的比喻,他将做 App 比作是在别人的花园里弄盆栽,「种点花草是没有问题的」,不过「别人叫你的产品下架你就得下架,这是有问题的」,现在在 GitHub 上,众多的开发者显然遭遇了这样的问题。
-
刚刚获悉,腾讯在光网络设备和数据中心领域的两大硬件自研设计“OPC-4”和“TMDC”顺利通过OCP(Open Compute Project)审核并正式接受为官方开源贡献。这是腾讯在硬件领域的开源设计首次被OCP官方正式认可,同时,腾讯也成为中国首家对OCP有开源贡献的互联网公司。
-
NVIDIA今日宣布,在NVIDIA GPU Cloud (NGC)容器注册上,向交通运输行业开源NVIDIA DRIVE™自动驾驶汽车开发深度神经网络。
-
11月28日,阿里云正式开源机器学习平台 Alink,这也是全球首个批流一体的算法平台,旨在降低算法开发门槛,帮助开发者掌握机器学习的生命全周期。
-
近日,开源数据库厂商MongoDB与阿里云在北京达成战略合作,作为合作的第一步,最新版MongoDB 4.2数据库产品正式上线阿里云平台。
-
-
首次落地中国大陆的OpenInfra:中国对于开源做出的贡献力量已不可忽视
一张标志着上海现代建筑地标的东方明珠海报,另一张展示着上海悠久历史的豫园景区海报,不仅向我们展示了这座城市浓厚的历史气息与现代化的繁荣,也让我们看到了OpenStack历经9年历史背后仍有着新鲜的科技气息。仅从这两张景色迷人且拥有时尚气息的两张海报,便能够看出此次开源基础设施峰会的用心良苦。没错,前身为OpenStack Summit的Open Infrastructure Summit首次落地中国大陆,而此次也正是阿丹第一次参加这场盛会,深感荣幸。
-
四大开源项目联合发布 腾讯已成Github全球贡献前十公司!
近日在Techo开发者大会上,腾讯正式对四大重点开源项目进行了联合发布,包括分布式消息中间件TubeMQ、基于最主流的 OpenJDK8开发的Tencent Kona JDK、分布式HTAP数据库 TBase,以及企业级容器平台TKEStack。
-
正式开源TKE和TBase,腾讯正成为大数据领域开源全面的厂商
在11月6日召开的Techo开发者大会上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士正式对外披露腾讯大数据平台10年技术演进历程。经过10年的积累,腾讯大数据平台的算力资源池目前已有超过20万台的规模,每天实时数据计算量超过30万亿条,并且随着资源管理平台核心TKE和分布式数据库TBase正式对外开源,腾讯正在成为大数据领域开源全面的公司。
-
首次落地中国大陆的OpenInfra:中国对于开源做出的贡献力量已不可忽视
一张标志着上海现代建筑地标的东方明珠海报,另一张展示着上海悠久历史的豫园景区海报,不仅向我们展示了这座城市浓厚的历史气息与现代化的繁荣,也让我们看到了OpenStack历经9年历史背后仍有着新鲜的科技气息。仅从这两张景色迷人且拥有时尚气息的两张海报,便能够看出此次开源基础设施峰会的用心良苦。没错,前身为OpenStack Summit的Open Infrastructure Summit首次落地中国大陆,而此次也正是阿丹第一次参加这项盛会,并感到十分荣幸。
-
雪花算法(snowflake) :分布式环境,生成全局唯一的订单号
snowflake是Twitter开源的分布式ID生成算法,结果是一个long型的ID。 这种方案大致来说是一种以划分命名空间(UUID也算,由于比较常见,所以单独分析)来生成ID的一种算法,这种方案把64-bit分别划分成多段,分开来标示机器、时间等。 其核心思想是:使用41bit作为毫秒数,10bit作为机器的ID(5个bit是数据中心,5个bit的机器ID),12bit作为毫秒内的流水号,最后还有一个符号位,永远是0。
-
Q:什么是Spark?A:简单理解,Spark是在Hadoop基础上的改进,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
