- 相关博文
- 最新资讯
-
在工业4.0与物联网(IoT)的驱动下,全球时序数据规模正以每年超过40%的速度增长。传统关系型数据库难以满足其存储与分析需求。时序数据库(Time-Series Database, TSDB)作为专门处理此类数据的工具,已成为工业互联网、能源监测、金融交易等领域的核心基础设施。在众多开源与商业产品中,Apache IoTDB凭借其自主可控的技术架构与工业场景深度优化,正逐步成为国产时序数据库的标杆。本文将从需求分析、技术对比、行业应用等维度,系统阐述IoTDB的选型价值。
-
本文结合 21 个案例(含 70 个极端天气站台),详解 Java 大数据在智能公交全场景的应用。极端天气预测准确率 88%,暴雪天滞留降 61%,车型适配让超载率从 25%→6%,附完整代码。
-
本文结合 15 个医疗案例,详解 Java 大数据在电子健康档案(EHR)中的应用。多源 EHR 整合准确率 99.2%,跨院调阅从 3 分钟→15 秒,慢性病预测准确率 89%,附隐私保护代码与服务创新方案。
-
在几乎所有现代分布式系统架构中,日志收集都是一个必须面对并解决的问题。因为在微服化、容器化的系统里,运行状态、错误排查、性能调优等都严重依赖于日志系统的支持。日志不再只是开发时调试的工具,更是生产环境中保障系统稳定性与可观测性的基础。那么,今天我们就从最初的 ELK 架构讲起,逐步介绍其演进路线及背后的技术逻辑,并深入剖析每一代日志收集架构的特点、优缺点及适用场景。
-
本文详细解析了 Elasticsearch 快照恢复 API 的三个核心参数:indices(指定恢复的索引)、rename_pattern(定义重命名匹配模式)和rename_replacement(定义重命名规则)。通过多个实际案例展示了参数组合使用效果,包括恢复特定索引、通配符匹配、排除索引以及复杂重命名等场景。文章特别强调了索引命名的规范要求,解释了 Elasticsearch 对字符长度和类型的限制原因,包括安全性、性能、兼容性等方面的技术考量。
-
在日常开发中,很多人使用数据库查询、缓存检索,但对真正的“搜索引擎”或“全文检索引擎”的底层原理知之甚少。尤其是像站内搜索、文档搜索这样的功能,其背后所依赖的技术体系,与我们常用的 SQL 查询完全不同。本文将从零讲起,带你系统了解全文检索引擎的工作机制:**它解决了什么问题?分词怎么做?倒排索引又是什么?它们如何协同支持用户的搜索请求?**如果你想构建自己的搜索系统,或想理解百度、ElasticSearch、Solr 等技术的底层,这篇文章会给你清晰的思路。
-
Kafka是一个分布式流处理平台,具有高吞吐量、低延迟的特点。作为消息队列,Kafka通过解耦生产者和消费者实现异步通信,提供削峰填谷、顺序保证等功能。安装时需要先启动ZooKeeper进行协调调度,再启动Kafka服务。通过命令行可以创建和管理主题(Topic),发送和消费消息。Java API操作需要配置生产者/消费者参数,包括服务器地址、序列化方式等。核心机制包括数据分区、消费者组订阅等,确保消息可靠传输和高效处理。Kafka适用于大数据实时处理场景,是构建分布式系统的关键中间件。
-
hbase 使用balance命令做数据均衡。
-
hbase region手动在线合并,merge_region
-
本文针对电商搜索系统性能瓶颈问题,提出Elasticsearch的优化策略。随着商品数据增长和多条件查询增加,搜索响应时间显著变慢。文章从倒排索引压缩、分片策略、深度分页处理和相关性算分四个维度展开分析: 倒排索引优化:介绍FST、Roaring Bitmap等压缩算法,提出字段类型选择和索引配置建议; 分片策略:阐述分片数量黄金法则,分析写入瓶颈机制,提供动态调整方案; 深度分页:剖析from/size的性能问题,推荐Search After和PIT等替代方案; 相关性算分:解析BM25算法原理,提出字段
-
HBase的RIT过程。
-
ES用IK Analyzer分词:先切成“今天”、“天气”、“真好”、“适合”、“打篮球”。如果没分词器,ES可能把“打篮球”切成“打”和“篮球”,结果搜索“篮球”时冒出“打架”内容——乱套了!一致性:默认是“最终一致”——订单可能延迟1秒显示,但你可以设置成“强一致”:顾客必须等所有分店都点头才下单,免得出现“我要少糖”变成“多糖”的悲剧(版本号防错)。自定义词典:加个“yyds”(永远的神),它就不会切成“y”、“y”、“d”、“s”了。试试看,输入“ES yyds”,它懂你的意思!
-
摘要:本文分享了"黑马点评"项目的学习资源,包括XMind思维导图文件(提供夸克网盘和百度网盘两种下载方式)。该项目是一个基于Redis的实战练习项目,涵盖完整功能实现、RabbitMQ优化方案,并配有15万字的详细学习笔记。资源还包括美团面试相关的项目话术指南、完整代码以及简历编写建议,适合开发者学习Redis应用和准备面试参考。
-
本文探讨了Java在大数据分布式存储中的应用,针对金融、医疗等行业的痛点问题提出解决方案。在金融高频交易场景中,Java方案通过内存缓存和异步写入将延迟从52ms降至8ms;银行灾备系统实现15秒故障检测和45秒切换,满足监管要求;医疗领域则平衡隐私保护与实时调阅,CT影像调阅时间从30秒缩短至1.2秒。研究基于18个行业案例,展示了Java如何通过全行业适配、数据安全可控和智能调度等核心能力,将存储延迟降低90%,扩容停机时间从8小时缩短至100ms,有效解决企业面临的存储性能瓶颈问题。
-
本文详细介绍了在CentOS 7.9环境下使用Docker和Docker Compose部署Elasticsearch 7.7.0三节点集群的完整流程。主要内容包括:创建Docker网络、生成SSL证书、编写配置文件、Docker Compose部署流程。部署过程中特别注意了内存锁定、安全认证等关键配置,并提供了设置用户名密码和验证集群状态的详细操作步骤。该方案可实现一个高可用的Elasticsearch集群环境。
-
优先检查文件权限和是否被其他程序占用,这是最常见的原因。如果是编辑器问题,尝试换一个编辑器(如从图形化工具换成终端编辑器)测试。操作后,可用命令确认内容是否已添加。合并的核心是代码内容的整合,而非分支本身的 “合并成一个”。合并后,源分支(如dev)可以保留(用于后续开发)或删除(如果已完成使命)。分支的 “关联” 是指它们共享部分提交历史,合并会让目标分支与源分支的历史产生关联,方便后续追溯。如果想彻底 “变成一个分支”,可以合并后删除其中一个分支(如),但这是手动操作,而非合并的必然结果。
-
Git 是一个分布式版本控制系统,可用于跟踪代码变更、与他人协作以及管理项目版本。
-
而在消息TTL中,连续发送过期时间长和过期时间短的消息,即使过期时间短的消息已经过期,只要过期时间长的消息还未过期,过期时间短的消息仍然会在队列中。比如消息1TTL为10s,消息2TTL为30s,消息2先发送,消息1后发送。比如订单超时支付自动取消,订单系统下单时设置延迟时间,并将订单消息投递到RabbitMQ中,消息超时则把订单消息发送给消费者(订单系统的订单状态处理模块),订单系统根据是否收到支付系统支付成功的消息或超时订单来修改订单状态(成功支付或超时未支付)。注意:队列TTL和消息TTL的区别。
-
Git作为当今最流行的分布式版本控制系统,已经成为开发者必备的技能之一。无论你是独立开发者还是团队协作,掌握Git的基本操作都能极大提高工作效率。本文将详细介绍Git的常用命令,帮助你快速上手并精通Git的基本使用。

-
AMD第二代7nm GPU现身:原生支持光追;Facebook曾洽谈收购Fitbit 但谷歌的报价是其两倍……...
极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周两次,打卡即read 更快、更全了解泛云圈精彩news go go go
-
不久之前,腾讯云刚刚对外上新了一款服务器,号称深度自研且独一无二,其名字也十二分的卡哇伊,叫做“星星海”。晶少虽然还没来得及探寻其名的出处,不过在与腾讯服务器供应链总经理刘裕勋的谈聊中已基本了解到星星海的重要style之一,为云而生。
-
四大开源项目联合发布 腾讯已成Github全球贡献前十公司!
近日在Techo开发者大会上,腾讯正式对四大重点开源项目进行了联合发布,包括分布式消息中间件TubeMQ、基于最主流的 OpenJDK8开发的Tencent Kona JDK、分布式HTAP数据库 TBase,以及企业级容器平台TKEStack。
-
加速布局无服务器生态,腾讯云与Serverless.com达成全球战略合作!
在云计算技术领域,“Serverless(无服务器)”作为一种新型的软件设计架构正在快速崛起。作为继虚拟机、容器后的第三代通用计算平台,Serverless技术也一直是腾讯云原生的重点发力领域。 近日,在由腾讯云主办的首届Techo开发者大会上,腾讯云宣布与全球最流行的Serverless开发平台Serverless.com达成战略合作,成为 Serverless.com的全球战略合作伙伴以及大中华区独家合作伙伴。截至目前,Serverless.com拥有百万级别的活跃应用程序以及50000+的日下载量。
-
邱跃鹏:软硬件一体化、Serverless、智能化是云计算三大趋势
近日腾讯公司副总裁、腾讯云总裁邱跃鹏在“腾讯Techo开发者”大会上致辞。他表示,云计算未来有三大趋势,即软硬件一体化(Cloud Native Hardware)、无服务器计算(Serverless)和智能化(Smart)。
-
正式开源TKE和TBase,腾讯正成为大数据领域开源全面的厂商
在11月6日召开的Techo开发者大会上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士正式对外披露腾讯大数据平台10年技术演进历程。经过10年的积累,腾讯大数据平台的算力资源池目前已有超过20万台的规模,每天实时数据计算量超过30万亿条,并且随着资源管理平台核心TKE和分布式数据库TBase正式对外开源,腾讯正在成为大数据领域开源全面的公司。
-
首次落地中国大陆的OpenInfra:中国对于开源做出的贡献力量已不可忽视
一张标志着上海现代建筑地标的东方明珠海报,另一张展示着上海悠久历史的豫园景区海报,不仅向我们展示了这座城市浓厚的历史气息与现代化的繁荣,也让我们看到了OpenStack历经9年历史背后仍有着新鲜的科技气息。仅从这两张景色迷人且拥有时尚气息的两张海报,便能够看出此次开源基础设施峰会的用心良苦。没错,前身为OpenStack Summit的Open Infrastructure Summit首次落地中国大陆,而此次也正是阿丹第一次参加这项盛会,并感到十分荣幸。
-
-
戴尔与AMD强强联合:五款PowerEdge服务器 ,让用户无法抗拒的选择
一口气发布5款产品,除了戴尔对于市场的乐观,更来源于对产品的自信,而这份自信则在于与AMD的强强联合。
-
AWS在中国区域放出了一款“重量级”容器服务,名为 AWS Fargate,光环新网运营的 AWS 中国(北京)区域和西云数据运营的 AWS 中国(宁夏)区域均提供该项服务。 据悉这是一款可以适用于 Amazon ECS的计算引擎,主要帮助企业在生产过程中运行容器、却无需部署或者管理服务器,换句话说就是专注设计和构建应用程序,而不用挂心太多基础设施的“那些事儿”。
2019-11-05 -
很多技术人总是抱怨 新技术/新框架/新概念 太多了,总是学不完,抱怨实在是学不动了。哈哈,这不,最近「 中台 」这么火热,要不要停止抱怨,再咬咬牙学一波? “很多人都担心被技术新潮流所抛弃,所以当遇见不断涌现的新技术时,总是慌忙的去学习。可是其中到底有多少是真正有用的?又有多少是昙花一现的技术呢?当你无法分辨的时候,其实不必慌张,当一项新技术/概念刚出现的时候,你不必匆忙的去学习,更不必担心自己会错过它,如果它是一个真正有价值的东西,是一个真正经受得住考验得技术,它迟早会再次出现在你面前”。
-
边缘计算无论是在市场规模、年均增速还是在实际落地方面,都有可能在TMT计算领域,上演“中心走向边缘,边缘走向中心”的一幕。只不过,对于边缘计算这个相对新鲜的领域,人们对其认知却有很多不当的地方,甚至是严重的误区,这主要表现在五大方面。不夸张地说,边缘计算里的这五个大坑,可能就有你跳过的。
-
是时候展现真正的技术了!4道程序员智力题你能对几道| IT巨能唠
程序员对很多人来说那就是个神秘组织,高薪、加班多都是他们的代名词。但是,大家好像还忘了一点,那就是他们也绝对聪明!黑客、代码天才、编程老手……层出不穷,晦涩的计算机难题也是分分钟搞定,想想就令人神往。那想不想试试自己是否也具备成为程序员的潜质呢,下面分享四道程序员面试智力题,请大家务必要大展身手,千万别谦虚~!
-
i 智慧 | 回首30年存储演进之路 再看新数据时代阿里云存储如何革故鼎新?
人类以日新月异的速度刷新着科技的成果,其中存储的发展历史尤其悠久,堪称万年进化史。自文明诞生以来,我们就一直在寻求能够更有效存储信息的方式,从4万年前的洞穴壁画、6000年前泥板上的楔形文字,到今天普及的SSD/闪存,再到对量子存储、DNA存储技术的探索,脚步从未停止。据IDC预测,2025年全球数据将有175 ZettaBytes的总量。如此惊人而又庞大的数据量,为存储市场带来机遇的同时,也带来了不小的挑战。
-
阿里云与MongoDB达成战略合作,成“唯一”;苹果将推出三款5G版iPhone;谷歌正式推出 TensorFlow 企业版……...
嗨,大家好,重磅君带来的【云重磅】特别栏目,如期而至,每周五第一时间为大家带来重磅新闻。把握技术风向标,了解行业应用与实践,就交给我重磅君吧!
-
程序员, 已经渐渐成当代相亲市场的一只主力军。 甚至可以说是“香饽饽”。 越来越多的妹子, 在写择偶要求时, 会说对程序员有好感。 因为他们, 踏实聪明又靠谱, 钱多花花肠子少。 但关于程序员谈恋爱的“笑点”也不少, 一起来看看吧!
-
雪花算法(snowflake) :分布式环境,生成全局唯一的订单号
snowflake是Twitter开源的分布式ID生成算法,结果是一个long型的ID。 这种方案大致来说是一种以划分命名空间(UUID也算,由于比较常见,所以单独分析)来生成ID的一种算法,这种方案把64-bit分别划分成多段,分开来标示机器、时间等。 其核心思想是:使用41bit作为毫秒数,10bit作为机器的ID(5个bit是数据中心,5个bit的机器ID),12bit作为毫秒内的流水号,最后还有一个符号位,永远是0。
-
“如今网络安全形势错综复杂,解决方案不可能由一家公司独当天下,面对这样的情况,我们就要选择自身擅长的领域发力,其他领域采取模块合作的方式。”在最近举行的2019合肥网络安全大会上,新华三集团高级副总裁、中国区总裁张力对在场媒体表示。
-
据晶少了解,国庆假期后的首个工作日,AWS就在中国区域放出了一款“重量级”容器服务,名为 AWS Fargate,光环新网运营的 AWS 中国(北京)区域和西云数据运营的 AWS 中国(宁夏)区域均提供该项服务。据悉这是一款可以适用于 Amazon ECS的计算引擎,主要帮助企业在生产过程中运行容器、却无需部署或者管理服务器,换句话说就是专注设计和构建应用程序,而不用挂心太多基础设施的“那些事儿”。