- 相关博文
- 最新资讯
-
在工业4.0与物联网(IoT)的驱动下,全球时序数据规模正以每年超过40%的速度增长。传统关系型数据库难以满足其存储与分析需求。时序数据库(Time-Series Database, TSDB)作为专门处理此类数据的工具,已成为工业互联网、能源监测、金融交易等领域的核心基础设施。在众多开源与商业产品中,Apache IoTDB凭借其自主可控的技术架构与工业场景深度优化,正逐步成为国产时序数据库的标杆。本文将从需求分析、技术对比、行业应用等维度,系统阐述IoTDB的选型价值。
-
本文结合 21 个案例(含 70 个极端天气站台),详解 Java 大数据在智能公交全场景的应用。极端天气预测准确率 88%,暴雪天滞留降 61%,车型适配让超载率从 25%→6%,附完整代码。
-
本文结合 15 个医疗案例,详解 Java 大数据在电子健康档案(EHR)中的应用。多源 EHR 整合准确率 99.2%,跨院调阅从 3 分钟→15 秒,慢性病预测准确率 89%,附隐私保护代码与服务创新方案。
-
在几乎所有现代分布式系统架构中,日志收集都是一个必须面对并解决的问题。因为在微服化、容器化的系统里,运行状态、错误排查、性能调优等都严重依赖于日志系统的支持。日志不再只是开发时调试的工具,更是生产环境中保障系统稳定性与可观测性的基础。那么,今天我们就从最初的 ELK 架构讲起,逐步介绍其演进路线及背后的技术逻辑,并深入剖析每一代日志收集架构的特点、优缺点及适用场景。
-
本文详细解析了 Elasticsearch 快照恢复 API 的三个核心参数:indices(指定恢复的索引)、rename_pattern(定义重命名匹配模式)和rename_replacement(定义重命名规则)。通过多个实际案例展示了参数组合使用效果,包括恢复特定索引、通配符匹配、排除索引以及复杂重命名等场景。文章特别强调了索引命名的规范要求,解释了 Elasticsearch 对字符长度和类型的限制原因,包括安全性、性能、兼容性等方面的技术考量。
-
在日常开发中,很多人使用数据库查询、缓存检索,但对真正的“搜索引擎”或“全文检索引擎”的底层原理知之甚少。尤其是像站内搜索、文档搜索这样的功能,其背后所依赖的技术体系,与我们常用的 SQL 查询完全不同。本文将从零讲起,带你系统了解全文检索引擎的工作机制:**它解决了什么问题?分词怎么做?倒排索引又是什么?它们如何协同支持用户的搜索请求?**如果你想构建自己的搜索系统,或想理解百度、ElasticSearch、Solr 等技术的底层,这篇文章会给你清晰的思路。
-
Kafka是一个分布式流处理平台,具有高吞吐量、低延迟的特点。作为消息队列,Kafka通过解耦生产者和消费者实现异步通信,提供削峰填谷、顺序保证等功能。安装时需要先启动ZooKeeper进行协调调度,再启动Kafka服务。通过命令行可以创建和管理主题(Topic),发送和消费消息。Java API操作需要配置生产者/消费者参数,包括服务器地址、序列化方式等。核心机制包括数据分区、消费者组订阅等,确保消息可靠传输和高效处理。Kafka适用于大数据实时处理场景,是构建分布式系统的关键中间件。
-
hbase 使用balance命令做数据均衡。
-
hbase region手动在线合并,merge_region
-
本文针对电商搜索系统性能瓶颈问题,提出Elasticsearch的优化策略。随着商品数据增长和多条件查询增加,搜索响应时间显著变慢。文章从倒排索引压缩、分片策略、深度分页处理和相关性算分四个维度展开分析: 倒排索引优化:介绍FST、Roaring Bitmap等压缩算法,提出字段类型选择和索引配置建议; 分片策略:阐述分片数量黄金法则,分析写入瓶颈机制,提供动态调整方案; 深度分页:剖析from/size的性能问题,推荐Search After和PIT等替代方案; 相关性算分:解析BM25算法原理,提出字段
-
HBase的RIT过程。
-
ES用IK Analyzer分词:先切成“今天”、“天气”、“真好”、“适合”、“打篮球”。如果没分词器,ES可能把“打篮球”切成“打”和“篮球”,结果搜索“篮球”时冒出“打架”内容——乱套了!一致性:默认是“最终一致”——订单可能延迟1秒显示,但你可以设置成“强一致”:顾客必须等所有分店都点头才下单,免得出现“我要少糖”变成“多糖”的悲剧(版本号防错)。自定义词典:加个“yyds”(永远的神),它就不会切成“y”、“y”、“d”、“s”了。试试看,输入“ES yyds”,它懂你的意思!
-
摘要:本文分享了"黑马点评"项目的学习资源,包括XMind思维导图文件(提供夸克网盘和百度网盘两种下载方式)。该项目是一个基于Redis的实战练习项目,涵盖完整功能实现、RabbitMQ优化方案,并配有15万字的详细学习笔记。资源还包括美团面试相关的项目话术指南、完整代码以及简历编写建议,适合开发者学习Redis应用和准备面试参考。
-
本文探讨了Java在大数据分布式存储中的应用,针对金融、医疗等行业的痛点问题提出解决方案。在金融高频交易场景中,Java方案通过内存缓存和异步写入将延迟从52ms降至8ms;银行灾备系统实现15秒故障检测和45秒切换,满足监管要求;医疗领域则平衡隐私保护与实时调阅,CT影像调阅时间从30秒缩短至1.2秒。研究基于18个行业案例,展示了Java如何通过全行业适配、数据安全可控和智能调度等核心能力,将存储延迟降低90%,扩容停机时间从8小时缩短至100ms,有效解决企业面临的存储性能瓶颈问题。
-
本文详细介绍了在CentOS 7.9环境下使用Docker和Docker Compose部署Elasticsearch 7.7.0三节点集群的完整流程。主要内容包括:创建Docker网络、生成SSL证书、编写配置文件、Docker Compose部署流程。部署过程中特别注意了内存锁定、安全认证等关键配置,并提供了设置用户名密码和验证集群状态的详细操作步骤。该方案可实现一个高可用的Elasticsearch集群环境。
-
优先检查文件权限和是否被其他程序占用,这是最常见的原因。如果是编辑器问题,尝试换一个编辑器(如从图形化工具换成终端编辑器)测试。操作后,可用命令确认内容是否已添加。合并的核心是代码内容的整合,而非分支本身的 “合并成一个”。合并后,源分支(如dev)可以保留(用于后续开发)或删除(如果已完成使命)。分支的 “关联” 是指它们共享部分提交历史,合并会让目标分支与源分支的历史产生关联,方便后续追溯。如果想彻底 “变成一个分支”,可以合并后删除其中一个分支(如),但这是手动操作,而非合并的必然结果。
-
Git 是一个分布式版本控制系统,可用于跟踪代码变更、与他人协作以及管理项目版本。
-
而在消息TTL中,连续发送过期时间长和过期时间短的消息,即使过期时间短的消息已经过期,只要过期时间长的消息还未过期,过期时间短的消息仍然会在队列中。比如消息1TTL为10s,消息2TTL为30s,消息2先发送,消息1后发送。比如订单超时支付自动取消,订单系统下单时设置延迟时间,并将订单消息投递到RabbitMQ中,消息超时则把订单消息发送给消费者(订单系统的订单状态处理模块),订单系统根据是否收到支付系统支付成功的消息或超时订单来修改订单状态(成功支付或超时未支付)。注意:队列TTL和消息TTL的区别。
-
Git作为当今最流行的分布式版本控制系统,已经成为开发者必备的技能之一。无论你是独立开发者还是团队协作,掌握Git的基本操作都能极大提高工作效率。本文将详细介绍Git的常用命令,帮助你快速上手并精通Git的基本使用。

-
数据库是应用及计算机的核心元素,负责存储运行软件应用所需的一切重要数据。为了保障应用正常运行,总有一个甚至多个数据库在默默运作。我们可以把数据库视为信息仓库,以结构化的方式存储了大量的相关信息,并合理分类,方便搜索及使用。
-
数据库连接池和线程池等池技术存在的意义都是为了解决资源的重复利用问题。在计算机里,创建一个新的资源往往开销是非常大的。而池技术可以统一分配,管理某一类资源,它允许我们的程序可以重复的使用这个资源,只有在极端情况下(比如连接池满)才会创建新的资源。
-
随着业务的发展,MySQL数据库中的表会越来越多,表中的数据量也会越来越大,相应地,数据操作的开销也会越来越大;另外,无论怎样升级硬件资源,单台服务器的资源(CPU、磁盘、内存、网络IO、事务数、连接数)总是有限的,最终数据库所能承载的数据量、数据处理能力都将遭遇瓶颈。
-
“删库跑路”这个词儿,经常被挂在嘴边当玩笑,是因为大家都知道,一旦真的发生这样的事情,企业损失是无比惨重的。
-
在线教育如何应对流量洪峰?阿里云专家:上云+云数据库是最佳路径
2月中下旬原本是全国各地春季学期开学的日子,但这场突如其来的疫情使得1.8亿中小学生只能纷纷在家开启“停课不停学”的学习生活,而线上教育也顺势成为了这一特殊时期首选的学习方式。
-
探索处理数据的新方法,8 个重点带你搞懂云数据库——DBaaS(数据库即服务)到底是什么!...
在分析的世界中,网站的每次点击都是数据分析的候选对象,显然,这会涉及大量的数据生成。
-
数据安全对企业生存发展有着举足轻重的影响,数据资产的外泄、破坏都会导致企业无可挽回的经济损失和核心竞争力缺失,而往往绝大多数中小企业侧重的是业务的快速发展,忽略了数据安全重要性。近年来,企业由于自身的安全防护机制不严谨,引发的数据安全事件频发。抛开事件本身的人为因素不谈,如何从技术角度避免类似的事件发生,才是我们需要认真总结的。
-
众志成城 共克时艰 TigerGraph免费开放企业级版本授权全力支持疫情防控
新型冠状病毒肺炎疫情自发生以来,一直牵动着全国人民的心。全球领先的可扩展企业级图数据库TigerGraph宣布,利用强大的企业级图数据库产品,免费开放企业级版本授权,为政府机构、公共事业和科研机构赋能,帮助实现更加科学和有效的研究和决策,减轻疫情对社会和经济的影响。
-
受疫情影响,多数企业员工目前无法回到写字楼办公,学生推迟开学,稳定高效的远程办公和直播授课成为2020年的开年刚需。腾讯从1月24日开始向全国免费开放可支持300人同时在线会议的“腾讯会议”,直至疫情结束。央视新闻联播对此也给予了报道。
-
近年来超融合在国内迎来快速增长,根据IDC最新发布的报告,2019上半年中国超融合市场增长率达56.7%,大幅超越去年同期。Gartner发布的最新报告,到2023年我国超融合市场依旧保持23%的快速增长。超融合覆盖范围正在进一步扩大,不仅服务的客户在向大规模企业扩张,应用场景也从服务器虚拟化、VDI扩展到数据库、私有云等关键业务。
-
12月3日,广州云峰会上,阿里云宣布推出面向混合云场景的CPFS一体机和视觉AI一体机,两款新品具备超高性能、开箱即用等特性,极大降低企业上云的周期和门槛。加上此前推出的POLARDB数据库一体机和蚂蚁mPaaS一体机,阿里云已为客户提供了四款一体机家族产品,集结了云、网、边、端一体化的能力,打破云的边界,让企业能够随时随地全栈、全态、甚至全域上云。
-
华为云TaurusDB计算存储分离架构:让数据“身”分离,“心”凝聚
在2019年HC大会上,华为重磅推出最新一代高扩展海量存储分布式数据库——TaurusDB,它拥有一个最大的特点就是将存储和计算以一种分离的架构形式运行。很多人就会问到,华为云为什么会设计这款产品?核心竞争力是什么?对比原生MySQL的优势有哪些?借此时机,CSDN记者有幸采访到了华为云TaurusDB数据库资深技术专家,现在就请他来为我们一一解答。
-
2019年技术盘点云数据库篇(一):UCloud专家谈云数据库:千锤百炼 云之重器
公有云逐渐成为企业运行 IT 设施的新趋势,那么作为企业最核心的系统—数据库,数据上云也成为大数据时代的必然选择。对企业来说,数据可视为其命脉,因此数据迁移上云就意味着将企业“命脉”搬到云平台。事实上,数据上云有两种形式,数据库直接上云或者选择云数据库,而云数据库利用其云原生的优势具备了许多过去数据库产品不具备的优势,包括可靠性、弹性、存储容量以及成本等,正逐渐被更多的企业所接受。
-
近日,开源数据库厂商MongoDB与阿里云在北京达成战略合作,作为合作的第一步,最新版MongoDB 4.2数据库产品正式上线阿里云平台。
-
CSDN云计算「C课有道」栏目趁着这股技术风潮再次如期而至啦!秉承「门门有路,路路有门」的理念,这次CSDN云计算小分队特邀阿里云、腾讯云、青云、天云等企业内的“国宝级”架构师,共同打造了一款数据库系列进阶教程,效果绝堪比“红宝书”。 从数据库宏观发展入手,内容主要涉及云数据库为代表的非关系型数据库、MySQL数据处理、分布式等诸多技术要点,将造福开发者设置为终极指标,纯技术绽放的精彩无限,实在不容错过。
-
四大开源项目联合发布 腾讯已成Github全球贡献前十公司!
近日在Techo开发者大会上,腾讯正式对四大重点开源项目进行了联合发布,包括分布式消息中间件TubeMQ、基于最主流的 OpenJDK8开发的Tencent Kona JDK、分布式HTAP数据库 TBase,以及企业级容器平台TKEStack。
-
正式开源TKE和TBase,腾讯正成为大数据领域开源全面的厂商
在11月6日召开的Techo开发者大会上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士正式对外披露腾讯大数据平台10年技术演进历程。经过10年的积累,腾讯大数据平台的算力资源池目前已有超过20万台的规模,每天实时数据计算量超过30万亿条,并且随着资源管理平台核心TKE和分布式数据库TBase正式对外开源,腾讯正在成为大数据领域开源全面的公司。
