- 相关博文
- 最新资讯
-
Alluxio 是世界上第一个面向基于云的数据分析和人工智能的开源的数据编排技术。 它为数据驱动型应用和存储系统构建了桥梁, 将数据从存储层移动到距离数据驱动型应用更近的位置从而能够更容易被访问。 这还使得应用程序能够通过一个公共接口连接到许多存储系统。 Alluxio内存至上的层次化架构使得数据的访问速度能比现有方案快几个数量级。
-
本文介绍了如何将Vertex AI与Elasticsearch集成来创建RAG应用。主要内容包括:1)配置Gemini模型并在Kibana Playground中使用;2)创建GCP服务账号并设置权限;3)部署Elasticsearch集群;4)创建AI Connector连接Vertex AI;5)上传测试数据并生成嵌入向量;6)在Playground中测试RAG功能,实现基于索引数据的问答。文章重点展示了使用gemini-2.5-flash-lite模型的完整流程,说明了Elasticsearch 9.
-
本文针对电商推荐系统的用户 / 商品冷启动问题,提出 Java 大数据 + 机器学习的解决方案。通过 Flink/Spark 补全用户(地域 / 设备等)与商品(文本 / 图片等)特征,结合 FM、GraphSAGE 等模型搭建关联,再用实时迭代策略动态调优。实战案例显示,该方案使新用户 CTR 从 2.1% 提至 5.8%,新商品首单时间从 7 天缩至 36 小时,为冷启动优化提供可复用技术路径。
-
Docker是一个开源的容器化平台,通过将应用程序及其依赖打包成轻量级容器,实现一次构建,到处运行。相比传统虚拟机,Docker容器启动更快(秒级)、资源占用更少(MB级),支持单个宿主机运行数百个容器。文章详细介绍了Docker的核心命令,包括镜像管理(pull/build/push)、容器操作(run/start/stop)、资源限制和网络配置等,并提供了Kafka等应用容器的示例部署方法。Docker已成为开发测试、微服务架构和云原生应用的核心工具。
-
SpringBoot 整合 Easy-Es 实战操作详解
-
本项目客户端使用Qt6.7.3+cmake进行搭建,需要在项目开始时选择git同步项目,具体环境如下图:没显示的就是不需要勾选的。需要跟随文章进行项目推进的话推荐与文章环境一致。相比于我们之前所实现的仿QQ音乐播放器,这个项目难度要比前者大的多。而且前项目qt5中与qt6中的使用过的函数如果功能没有发生太大变化,我们会省略的去介绍这些功能。希望读者最好是将音乐播放器的项目做完之后再来学习本项目。
-
Paimon——官网阅读:非主键表
-
上海斯歌围绕企业数字化转型的核心痛点,打造了兼具“BPM+AI、低代码、国产化、云原生”四大核心的产品矩阵,其中AI助手“小歌”,可精准识别自然语言、语音及各类附件,协助用户快速完成表单生成、流程绘制、代码编写、规则制定、流程智能审批与发起等工作,重构“对话即办公”的高效场景。截至目前,上海斯歌已累计服务超 750 家大型企业,直接赋能用户突破500万,业务版图覆盖制造、能源、化工、地产、汽车、医药、IT 互联网等20余个主流行业,在不同行业的复杂业务场景中,沉淀了丰富的实践经验。
-
Elasticsearch基础入门-微服务原理以及基础的增删改查
-
Flink 的窗口模型支持通过 Evictor 在窗口计算前后删除元素,提供了更灵活的数据处理能力。Evictor 接口包含 evictBefore 和 evictAfter 方法,分别用于窗口函数调用前后的元素剔除。Flink 内置了三种 Evictor:CountEvictor(保留指定数量元素)、DeltaEvictor 和 TimeEvictor。以 CountEvictor 为例,其通过迭代器从窗口头部删除多余元素,可通过参数控制在窗口函数前后执行剔除。示例代码展示了如何结合事件时间滚动窗口
-
本文介绍了一个自动化同步Git仓库到Gitee的Shell脚本。该脚本主要功能包括:1)批量同步多个仓库;2)支持自定义目标仓库名称;3)可选择保留或清除提交记录;4)支持保留或忽略分支;5)自动生成SSH公钥。使用前需配置源仓库信息、Gitee令牌和组织名,通过REPO_MAPPINGS数组设置仓库映射关系。脚本会处理仓库命名规范,通过API创建Gitee仓库,并提供交互选项决定是否保留历史记录。执行后自动清理临时文件,适合服务器迁移时批量同步Git仓库。
-
YOLOv8无人机目标检测跟踪识别系统 深度学习 PySide界面设计 大数据 毕业设计✅
-
中间件考察重点围绕核心原理(如Redis数据结构、Kafka分区)、高可用设计(集群、副本)、实际问题解决(缓存击穿、消息积压)。建议结合场景理解技术选型差异,例如Redis适合高速读写,Kafka侧重高吞吐日志流,RabbitMQ强调灵活路由。
-
元宇宙作为企业数字化转型的下一站,正在重构商业场景——从沉浸式数字人客服到实时数字孪生工厂,从VR协同设计到虚拟展会,AI模型是元宇宙的“大脑”,支撑着所有智能交互与决策。但元宇宙的特殊性低延迟要求:虚拟环境中的交互(如数字人对话、VR手势识别)需要端到端延迟<100ms,传统集中式部署(如云端统一推理)无法满足;高并发压力:百万级用户同时访问(如虚拟演唱会、线上展会),要求AI服务能应对每秒10万+次请求;实时交互需求:元宇宙中的“活数据”(如用户实时动作、环境动态变化)需要AI模型流式推理。
-
与使用方(设计团队、业主)确认核心功能:能耗数据实时采集(每5分钟一次)、设备运行参数监控(如空调、照明)、能耗趋势可视化(日/月/年报表)、异常告警(如能耗突增)。Redis:主从+哨兵架构(3个哨兵节点),主节点缓存实时能耗数据(过期时间5分钟),从节点备份,哨兵实现主从自动切换(故障转移时间<30s)。开发响应式前端(Vue 框架),支持PC端(大屏展示)与移动端(随时查看),通过 Nginx 部署静态资源,TomCat动态解析。高可用集群部署(VRRP+Keepalived+HAproxy)
-
基于hadoop的豆瓣电影分析与推荐可视化系统
-
Docker部署单节点Kafka与KafkaMap可视化界面实践 摘要:本文详细介绍了使用Docker部署无ZooKeeper的单节点Kafka(3.8.0版本)及KafkaMap可视化界面的完整过程。重点说明:1)Kafka自3.5版本起弃用ZooKeeper,推荐使用KRaft模式;2)提供完整的Docker运行命令及参数详解,包括网络配置、端口映射、KRaft模式特有参数等;3)部署KafkaMap实现可视化监控;4)强调生产环境与测试环境的配置差异。通过容器化部署方案,可快速搭建Kafka开发测试环
-
本文介绍了如何安装和配置Elasticsearch MCP Server,实现通过自然语言与Elasticsearch交互。主要内容包括:安装Elasticsearch和Kibana 9.1.2版本;获取API key;安装Claude Desktop客户端;通过Docker部署MCP服务器,支持stdio协议和环境变量配置;设置Claude Desktop连接MCP服务器;最后展示了使用自然语言查询航班索引数据的示例,验证了MCP服务器的功能。该方案简化了Elasticsearch查询,无需编写复杂的DS
-
NVIDIA驱动初始化流程涉及两个关键函数:nvidia_init_module和nvkms_init。nvidia_init_module是驱动加载总入口,负责初始化内存调试、procfs节点、GPU设备探测、PCI驱动加载、字符设备注册等核心功能,采用分层错误处理机制确保资源正确释放。nvkms_init专门初始化Kernel Mode Setting子系统,包括资源管理器分配、内核线程队列创建、定时器初始化、字符设备注册和配置文件读取,同样配备完善的错误处理流程。两个函数都包含详细的日志输出和错误检查

-
数据库是应用及计算机的核心元素,负责存储运行软件应用所需的一切重要数据。为了保障应用正常运行,总有一个甚至多个数据库在默默运作。我们可以把数据库视为信息仓库,以结构化的方式存储了大量的相关信息,并合理分类,方便搜索及使用。
-
其实“数据湖”的概念由来已久,如果追溯时间大概可以到2011年。如今我们经常提及的数据湖其实可以被认为是一个集中式的安全存储库,用户可以任何规模存储、管理、发现并共享所有结构化和非结构化数据,过程中无需预定义架构。
-
随着数字化的进程,数据的处理、存储和传输得到了飞速的发展。高带宽的需求使得短距互联成了系统发展的瓶颈。受损耗和串扰等因素的影响,基于铜线的电互联的高带宽情况下的传输距离受到了限制,成本也随之上升。而且过多的电缆也会增加系统的重量和布线的复杂度。与电互连相比,基于多模光纤的光互连具有高带宽、低损耗、无串扰和匹配及电磁兼容等问题,而开始广泛地应用于机柜间、框架间和板间的高速互连。
-
云+X案例展 | 金融类:荣之联助力君康人寿构建新一代数据中心
近年来,互联网、大数据、云计算和物联网等行业的蓬勃发展,对数据的存储、交换、计算等的应用需求不断增加,使得大数据发展需求下对上游基础设施领域的需求持续旺盛,促进了数据中心(简称“IDC”)需求的不断增加。同时,各国5G技术的发展和商用化的推广又进一步促进了IDC行业爆发增长。未来,IDC行业必将成为物联网、云计算及5G技术的不断完善与发展下又一风口。
-
云+X案例展 | 民生类:智领云数据中台为“健康武汉”增砖添瓦
与前一个十年相比,如今企业对大规模应用的需求产生了巨大变化,例如: 在互联网领域内,高度连接的应用在海量数据的情况下对于可靠性、性能以及连接性的要求有了数个数量级的提高; 快速响应商业洞见; 快速响应市场/客户需求; 对于企业来说数据的存储、收集和分析变得至关重要,对前沿科技的技术(机器学习,人工智能)支持变得至关重要。
-
华为云TaurusDB计算存储分离架构:让数据“身”分离,“心”凝聚
在2019年HC大会上,华为重磅推出最新一代高扩展海量存储分布式数据库——TaurusDB,它拥有一个最大的特点就是将存储和计算以一种分离的架构形式运行。很多人就会问到,华为云为什么会设计这款产品?核心竞争力是什么?对比原生MySQL的优势有哪些?借此时机,CSDN记者有幸采访到了华为云TaurusDB数据库资深技术专家,现在就请他来为我们一一解答。
-
2019年技术盘点云数据库篇(一):UCloud专家谈云数据库:千锤百炼 云之重器
公有云逐渐成为企业运行 IT 设施的新趋势,那么作为企业最核心的系统—数据库,数据上云也成为大数据时代的必然选择。对企业来说,数据可视为其命脉,因此数据迁移上云就意味着将企业“命脉”搬到云平台。事实上,数据上云有两种形式,数据库直接上云或者选择云数据库,而云数据库利用其云原生的优势具备了许多过去数据库产品不具备的优势,包括可靠性、弹性、存储容量以及成本等,正逐渐被更多的企业所接受。
-
随着移动互联网、信息技术等创新发展,数据量呈指数级爆发式增长并表现在多个方面,即规模扩张、结构多元化的数据新形态;业务升级转型带来的场景化需求数据新部署;市场细分带来的数据应用新模式以及承载行业发展,发挥核心资源池地位的数据新价值等。据IDC预测,全球数据圈将从2018年的33ZB增至2025年的175ZB,实现5倍以上的增长。在新数据时代,数据在数据形态、部署环境、应用模式和价值需求等方面均出现了更为精细化的需求,应对数据爆发压力,欲将海量的连接、微秒级的延迟、极高的性能体验为我所用,创新存储价值则变得势在必行。
-
点赞功能大家都不会陌生,像微信这样的社交产品中都有,但别看功能小,想要做好需要考虑的东西还挺多的,如海量数据的分布式存储、分布式缓存、多IDC的数据一致性、访问路由到机房的算法等等。
-
-
腾讯Techo开发者大会揭晓云存储发展趋向:高性能、高可用、高性价比
产业数字化转型过程中产生着比过去任何一个时代都多的数据。在这样的背景下,数据存储技术应该怎么发展?11月7日,在腾讯Techo开发者大会上,来自科研领域的专家和腾讯云存储业务的工程师们共同揭开了云存储的发展趋势。
-
戴尔与AMD强强联合:五款PowerEdge服务器 ,让用户无法抗拒的选择
一口气发布5款产品,除了戴尔对于市场的乐观,更来源于对产品的自信,而这份自信则在于与AMD的强强联合。
-
i 智慧 | 回首30年存储演进之路 再看新数据时代阿里云存储如何革故鼎新?
人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史。自文明诞生以来,我们就一直在寻求能够更有效存储信息的方式,从4万年前的洞穴壁画、6000年前泥板上的楔形文字,到今天普及的SSD/闪存,再到对量子存储、DNA存储技术的探索,脚步从未停止。据IDC预测,2025年全球数据将有175 ZettaBytes的总量。如此惊人而又庞大的数据量,为存储市场带来机遇的同时,也带来了不小的挑战。
-
排序算法这么多,这里先将排序算法做个简单分类: 一、可以根据待排序的数据量规模分类: 内部排序:在排序过程中,待排序的数据能够被全部加载进内存中 外部排序:待排序的数据太大,不能全部同时放入内存,排序过程中需要内存与外部存储交换数据
-
阿里云存储负责人吴结生:安全可靠是云存储立身之本, 智能技术将激活存储技术新变革...
人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史。自文明诞生以来,我们就一直在寻求能够更有效存储信息的方式,从4万年前的洞穴壁画、6000年前泥板上的楔形文字,到今天普及的SSD/闪存,再到对量子存储、DNA存储技术的探索,脚步从未停止。
