- 相关博文
- 最新资讯
-
如果你项目中有使用websocket,面试官拷打项目时候可能会问Websocket是一种协议,用于在客户端和服务器之间建立持久的双向通信连接,广泛应用于需要实时数据交换的应用程序核心特点持久连接:一旦建立连接,客户端和服务器保持长期通信状态,无需频繁创建和关闭连接。双向通信:服务器可以主动向客户端推送数据,客户端也可以随时向服务器发送数据,打破了 HTTP 中只能由客户端发起请求的限制。低开销:连接建立后,数据传输时无需携带大量 HTTP 头部信息,减少带宽消耗。
-
摘要 商业智能(BI)的未来发展趋势聚焦五大方向: AI与BI融合:通过机器学习、自然语言处理等技术实现自动化洞察与智能决策,提升分析效率,国内厂商正加速AI功能整合。 实时BI普及:依托5G、IoT和流处理技术,支持动态数据监控与快速响应,帮助企业优化运营效率。 嵌入式BI兴起:将分析功能集成至业务系统(如CRM、ERP),降低使用门槛,提升决策便捷性。 数据民主化:通过自助分析工具赋能非技术人员,推动全员数据驱动文化,国内BI工具注重中文适配与权限管理。
-
摘要:本文详细介绍了使用Ansible自动化部署Elasticsearch集群的全过程。
-
使用 Confirm + Return 确认机制,确保消息可靠到达 Exchange。消费方手动 ACK,防止消息丢失。幂等控制前置化,不要在最后才处理重复。核心队列独立交换机,避免耦合混乱。监控链路可视化,别让 MQ 成为黑盒。拼团系统天然需要应对“高并发 + 延迟逻辑 + 状态幂等”,而 RabbitMQ 通过“异步化、解耦化、延迟化”三个特性,更强的容错性更快的响应速度更高的扩展潜力如果你也在写自己的业务系统,不妨先从一个延迟队列开始,
-
教育大数据通过分析学生学习行为数据(如学习时长、答题正确率、资源访问频率等),可构建个性化学习路径推荐模型,帮助学生高效学习。以下逐步介绍整个流程,确保结构清晰、方法可靠。模型构建基于实际教育场景,结合数据挖掘和推荐系统技术。通过以上步骤,教育大数据分析能构建有效的个性化学习路径推荐模型。该方法基于真实数据,推荐路径可动态调整(如根据学生进度更新模型),提升学习成效。未来可集成更多数据源(如情感分析)以增强个性化。收集学生学习行为数据,包括日志文件、交互记录等。
-
假设向量维度为 128,并归一化向量(使范数为 1),以提高计算效率(归一化后,余弦相似度简化为点积:$\cos(\theta) = \mathbf{a} \cdot \mathbf{b}$)。字段类型存储高维向量,并使用自定义查询实现相似度计算。余弦相似度是一种常用的相似度度量方法,它衡量两个向量之间的角度差异,而不受向量大小的影响。余弦相似度范围在 $[-1, 1]$ 之间,值越接近 1 表示向量越相似。查询自定义评分脚本,计算查询向量与文档向量的余弦相似度。确保向量在插入前已归一化(范数为 1)。
-
数据标准化是使用统计学的手段对数据样本执行一定范围的缩放,使数据元素保持在一定的范围之内,标准化的数据集合在数据分析以及图表绘制中,更加容易地体现出数据的固有特性,Apache Spark支持的数据标准化以及数据缩放的方法:
-
英伟达将 Sionna Research Kit 和 Aerial Testbed 部署在 DGX Spark 平台上,为研究人员提供了强大的工具和便捷的访问方式,从而加速 AI 原生无线创新的进程。原文:https://blogs.nvidia.com/blog/open-source-aerial-ai-native-6g/?英伟达正为电信行业提供强有力的推动力,推出开源软件以构建。英伟达即将以开源形式发布,并将在包括在内的多种平台上提供。
-
摘要:装配行业数字化转型面临生产协同低效、数据采集滞后、质量追溯困难等核心痛点。解决方案包括:搭建一体化MES系统实现智能排产和物料精细管理;构建全场景数据采集体系实时监控生产;建立产品全生命周期追溯系统;优化库存与设备管理;打造可视化决策平台。实施需注重基础数据标准化、软硬件协同部署和人员培训,建议制定分步实施清单推动项目落地(共147字)。
-
本文介绍了Spark中的三个重要转换算子:zipWithIndex、mapPartitions和mapPartitionsWithIndex的使用案例。zipWithIndex用于将RDD元素与其索引组成键值对;mapPartitions以分区为单位处理数据,适合批量操作如数据库连接;mapPartitionsWithIndex则在处理分区数据时能获取分区索引。文章分别展示了Java和Scala两种语言的实现代码,并通过示例演示了这些算子在实际应用中的场景和优势,如减少重复初始化开销等。运行结果显示这些算子
-
本文系统介绍了分布式架构中四种数据库(MySQL、PostgreSQL、Redis、MongoDB)的数据变更感知(CDC)实现方案。MySQL基于Binlog的RBR模式,PostgreSQL通过WAL逻辑复制槽,MongoDB使用官方Change Streams,Redis则依赖有限的Keyspace通知功能。文章详细对比了各方案优缺点,并提出了通用工程化实践,包括全量+增量同步、断点续传、事件幂等处理等。建议将权威数据源CDC与消息总线结合构建平台化方案,同时指出Redis仅适合作为辅助缓存联动。
-
与。
-
摘要:本文探讨如何利用Elasticsearch+Faiss实现自动驾驶PB级视频库的高效向量搜索。通过将视频特征向量与元数据存储在ES中,结合Faiss的ANN搜索能力,可快速检索"雨天无保护左转"等复杂场景。文章详细介绍了索引设计、向量生成、kNN查询和混合搜索优化方案,并提供了Haystack框架下的Python实现示例。该方案突破传统关键词搜索局限,实现毫秒级语义检索,为自动驾驶模型训练提供海量场景数据支持。
-
本文以智慧物流场景为主线,通过面试问答梳理Java主流技术点及其应用,涵盖分布式、微服务、消息队列、AI与大数据等业务核心。详细解析帮助小白系统掌握智慧物流后端开发与面试重点。
-
可扩展性:基于 SPI 机制,支持用户自定义扩展灵活性:通过多级匹配策略处理复杂的 TableFactory 选择场景错误诊断:提供详细的错误信息帮助用户调试配置问题。
-
本文介绍数据仓库的概念、特点及技术实现。数据仓库诞生的背景是企业各业务系统数据不一致、缺乏统一规范。其核心特点是面向主题、集成、非易失和时变,与面向事务的数据库形成对比(OLTP vs OLAP)。技术实现上,传统MPP架构适合中等规模数据,但存在扩展性和热点问题;大数据分布式架构更适合海量数据处理。常见产品包括Oracle RAC、Teradata等传统方案,以及Hive、Spark SQL等大数据方案。数据仓库主要用于历史数据分析,为决策提供支持。
-
Gerrit环境搭建
-
本文介绍了在Elasticsearch中使用GPT-OSS模型进行语义搜索的方法。首先需要安装GPT-OSS并建立索引,但发现ELSER模型不支持中文查询。解决方案是改用多语言模型.multilingual-e5-small-elasticsearch,重新定义索引映射并导入测试数据。文章还提到Elastic公司收购的JINA支持多模态嵌入模型,可参考相关文章进行测试。通过调整模型配置,最终成功实现了预期的语义搜索功能。
-
为什么需要用深度学习做隐私保护?假设你是医院的数据科学家,想用水痘患者的病历训练“水痘预测模型”,但病历里有患者的姓名、年龄、体温、用药记录——直接用这些数据会违法(比如违反《个人信息保护法》),但“删掉姓名”还不够(攻击者能通过“28岁+女性+39℃+用阿昔洛韦”定位到具体的人)。传统方法比如“全加密”,虽然安全但无法直接用加密数据训练模型;“抽样数据”会损失信息,导致模型不准。它能在“保护隐私”和“保留数据价值”之间找到平衡。
-
近一段时间,Serverless的横空出世似乎让大家发现了架构开发的新乐园。无需纷繁复杂的后台开发配置,更不用介怀巨型架构体系造成的“迷宫”困境,开发人员轻松上阵即可完成过去耗时数小时才能搞定的初始版本,极大缩短技术研发与市场检验的距离。
-
-
-
近日2019甲骨文云大会在上海举行。大会今年以“超越,由此开启”为主题,聚集了众多数字化领军企业代表,与合作伙伴、技术专家和意见领袖一起共同探讨技术创新将如何帮助企业探索数据价值,创造无限可能。
-
如果有人要问2019年技术圈什么最热,“中台”绝对当仁不让,从观望到试水,很多公司做出了从 0 到 1 的探索。众所周知,“中台”一词在国内最早是由阿里提出来的,2015 年,马云参观芬兰游戏公司Supercell,观察其每个游戏开发的小团队只有六七个人,但开发与停止的速度之快,让马云即惊讶又好奇。得知如此快的原因是开发者将游戏开发过程中用到的一些通用的游戏素材和算法整理出来,作为工具提供给小团队使用,使得同一套工具可以支持多个游戏研发团队。这样的架构模式给了马云很大的震撼和启发,这也催生了阿里巴巴的中台战略,加之越来越的企业跟随其热度,寄希望于借助中台推动业务增长以快速实现数字化转型, “中台”得以风靡。
-
i 智慧 | 为云而生、多快好省,这就是星星海的style!
不久之前,腾讯云刚刚对外上新了一款服务器,号称深度自研且独一无二,其名字也十二分的卡哇伊,叫做“星星海”。晶少虽然还没来得及探寻其名的出处,不过在与腾讯服务器供应链总经理刘裕勋的谈聊中已基本了解到星星海的重要style之一,为云而生。
-
IBM在中国发布Cloud Paks,牵手神州数码,助力企业云转型步入“第二篇章”
近日IBM中国今天宣布,IBM已经将其软件组合转化为云原生,并对其进行优化,使之在红帽OpenShift上运行。首批转型成果——IBM Cloud Paks产品组合——正式亮相中国市场。
-
CSDN云计算现强势开启“云+X”案例征集活动,从先进性、拓展性、效益性等三个基本方向出发,深入展现云技术作用行业的突出优势。我们有理由相信,挖掘展现更多优秀案例定会给不同行业领域带来启迪,进而推动整个“云+行业”的健康发展。
-
腾讯Techo开发者大会揭晓云存储发展趋向:高性能、高可用、高性价比
产业数字化转型过程中产生着比过去任何一个时代都多的数据。在这样的背景下,数据存储技术应该怎么发展?11月7日,在腾讯Techo开发者大会上,来自科研领域的专家和腾讯云存储业务的工程师们共同揭开了云存储的发展趋势。
-
世界第一超算Summit需要大约1万年来完成的计算,量子计算机需要多久? 谷歌研究人员给出答案:3分20秒。 据英国《金融时报》报道,谷歌研究人员在本周向美国国家航空航天局(NASA)提交的论文中写道,其实验标志着量子处理器上执行的首次计算。而这一堪称“恐怖”的计算速度,被研究人员称作是“量子霸权”的证明。
-
没有美支持,华为表示其5G仍能保持世界领先;谷歌发布补丁;微软发布 SQL Server 2019 新版本……...
速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周两次,打卡即read 更快、更全了解泛云圈精彩news go go go
-
首次落地中国大陆的OpenInfra:中国对于开源做出的贡献力量已不可忽视
一张标志着上海现代建筑地标的东方明珠海报,另一张展示着上海悠久历史的豫园景区海报,不仅向我们展示了这座城市浓厚的历史气息与现代化的繁荣,也让我们看到了OpenStack历经9年历史背后仍有着新鲜的科技气息。仅从这两张景色迷人且拥有时尚气息的两张海报,便能够看出此次开源基础设施峰会的用心良苦。没错,前身为OpenStack Summit的Open Infrastructure Summit首次落地中国大陆,而此次也正是阿丹第一次参加这场盛会,深感荣幸。
-
12306 的技术扒光在你面前,100 万人如何抢 1 万张票
12306 抢票,极限并发带来的思考。 每到节假日期间,一二线城市返乡、外出游玩的人们几乎都面临着一个问题:抢火车票!虽然现在大多数情况下都能订到票,但是放票瞬间即无票的场景,相信大家都深有体会。
-




















