- 相关博文
- 最新资讯
-
在工业4.0与物联网(IoT)的驱动下,全球时序数据规模正以每年超过40%的速度增长。传统关系型数据库难以满足其存储与分析需求。时序数据库(Time-Series Database, TSDB)作为专门处理此类数据的工具,已成为工业互联网、能源监测、金融交易等领域的核心基础设施。在众多开源与商业产品中,Apache IoTDB凭借其自主可控的技术架构与工业场景深度优化,正逐步成为国产时序数据库的标杆。本文将从需求分析、技术对比、行业应用等维度,系统阐述IoTDB的选型价值。
-
本文结合 21 个案例(含 70 个极端天气站台),详解 Java 大数据在智能公交全场景的应用。极端天气预测准确率 88%,暴雪天滞留降 61%,车型适配让超载率从 25%→6%,附完整代码。
-
本文结合 15 个医疗案例,详解 Java 大数据在电子健康档案(EHR)中的应用。多源 EHR 整合准确率 99.2%,跨院调阅从 3 分钟→15 秒,慢性病预测准确率 89%,附隐私保护代码与服务创新方案。
-
在几乎所有现代分布式系统架构中,日志收集都是一个必须面对并解决的问题。因为在微服化、容器化的系统里,运行状态、错误排查、性能调优等都严重依赖于日志系统的支持。日志不再只是开发时调试的工具,更是生产环境中保障系统稳定性与可观测性的基础。那么,今天我们就从最初的 ELK 架构讲起,逐步介绍其演进路线及背后的技术逻辑,并深入剖析每一代日志收集架构的特点、优缺点及适用场景。
-
本文详细解析了 Elasticsearch 快照恢复 API 的三个核心参数:indices(指定恢复的索引)、rename_pattern(定义重命名匹配模式)和rename_replacement(定义重命名规则)。通过多个实际案例展示了参数组合使用效果,包括恢复特定索引、通配符匹配、排除索引以及复杂重命名等场景。文章特别强调了索引命名的规范要求,解释了 Elasticsearch 对字符长度和类型的限制原因,包括安全性、性能、兼容性等方面的技术考量。
-
在日常开发中,很多人使用数据库查询、缓存检索,但对真正的“搜索引擎”或“全文检索引擎”的底层原理知之甚少。尤其是像站内搜索、文档搜索这样的功能,其背后所依赖的技术体系,与我们常用的 SQL 查询完全不同。本文将从零讲起,带你系统了解全文检索引擎的工作机制:**它解决了什么问题?分词怎么做?倒排索引又是什么?它们如何协同支持用户的搜索请求?**如果你想构建自己的搜索系统,或想理解百度、ElasticSearch、Solr 等技术的底层,这篇文章会给你清晰的思路。
-
Kafka是一个分布式流处理平台,具有高吞吐量、低延迟的特点。作为消息队列,Kafka通过解耦生产者和消费者实现异步通信,提供削峰填谷、顺序保证等功能。安装时需要先启动ZooKeeper进行协调调度,再启动Kafka服务。通过命令行可以创建和管理主题(Topic),发送和消费消息。Java API操作需要配置生产者/消费者参数,包括服务器地址、序列化方式等。核心机制包括数据分区、消费者组订阅等,确保消息可靠传输和高效处理。Kafka适用于大数据实时处理场景,是构建分布式系统的关键中间件。
-
hbase 使用balance命令做数据均衡。
-
hbase region手动在线合并,merge_region
-
本文针对电商搜索系统性能瓶颈问题,提出Elasticsearch的优化策略。随着商品数据增长和多条件查询增加,搜索响应时间显著变慢。文章从倒排索引压缩、分片策略、深度分页处理和相关性算分四个维度展开分析: 倒排索引优化:介绍FST、Roaring Bitmap等压缩算法,提出字段类型选择和索引配置建议; 分片策略:阐述分片数量黄金法则,分析写入瓶颈机制,提供动态调整方案; 深度分页:剖析from/size的性能问题,推荐Search After和PIT等替代方案; 相关性算分:解析BM25算法原理,提出字段
-
HBase的RIT过程。
-
ES用IK Analyzer分词:先切成“今天”、“天气”、“真好”、“适合”、“打篮球”。如果没分词器,ES可能把“打篮球”切成“打”和“篮球”,结果搜索“篮球”时冒出“打架”内容——乱套了!一致性:默认是“最终一致”——订单可能延迟1秒显示,但你可以设置成“强一致”:顾客必须等所有分店都点头才下单,免得出现“我要少糖”变成“多糖”的悲剧(版本号防错)。自定义词典:加个“yyds”(永远的神),它就不会切成“y”、“y”、“d”、“s”了。试试看,输入“ES yyds”,它懂你的意思!
-
摘要:本文分享了"黑马点评"项目的学习资源,包括XMind思维导图文件(提供夸克网盘和百度网盘两种下载方式)。该项目是一个基于Redis的实战练习项目,涵盖完整功能实现、RabbitMQ优化方案,并配有15万字的详细学习笔记。资源还包括美团面试相关的项目话术指南、完整代码以及简历编写建议,适合开发者学习Redis应用和准备面试参考。
-
本文探讨了Java在大数据分布式存储中的应用,针对金融、医疗等行业的痛点问题提出解决方案。在金融高频交易场景中,Java方案通过内存缓存和异步写入将延迟从52ms降至8ms;银行灾备系统实现15秒故障检测和45秒切换,满足监管要求;医疗领域则平衡隐私保护与实时调阅,CT影像调阅时间从30秒缩短至1.2秒。研究基于18个行业案例,展示了Java如何通过全行业适配、数据安全可控和智能调度等核心能力,将存储延迟降低90%,扩容停机时间从8小时缩短至100ms,有效解决企业面临的存储性能瓶颈问题。
-
本文详细介绍了在CentOS 7.9环境下使用Docker和Docker Compose部署Elasticsearch 7.7.0三节点集群的完整流程。主要内容包括:创建Docker网络、生成SSL证书、编写配置文件、Docker Compose部署流程。部署过程中特别注意了内存锁定、安全认证等关键配置,并提供了设置用户名密码和验证集群状态的详细操作步骤。该方案可实现一个高可用的Elasticsearch集群环境。
-
优先检查文件权限和是否被其他程序占用,这是最常见的原因。如果是编辑器问题,尝试换一个编辑器(如从图形化工具换成终端编辑器)测试。操作后,可用命令确认内容是否已添加。合并的核心是代码内容的整合,而非分支本身的 “合并成一个”。合并后,源分支(如dev)可以保留(用于后续开发)或删除(如果已完成使命)。分支的 “关联” 是指它们共享部分提交历史,合并会让目标分支与源分支的历史产生关联,方便后续追溯。如果想彻底 “变成一个分支”,可以合并后删除其中一个分支(如),但这是手动操作,而非合并的必然结果。
-
Git 是一个分布式版本控制系统,可用于跟踪代码变更、与他人协作以及管理项目版本。
-
而在消息TTL中,连续发送过期时间长和过期时间短的消息,即使过期时间短的消息已经过期,只要过期时间长的消息还未过期,过期时间短的消息仍然会在队列中。比如消息1TTL为10s,消息2TTL为30s,消息2先发送,消息1后发送。比如订单超时支付自动取消,订单系统下单时设置延迟时间,并将订单消息投递到RabbitMQ中,消息超时则把订单消息发送给消费者(订单系统的订单状态处理模块),订单系统根据是否收到支付系统支付成功的消息或超时订单来修改订单状态(成功支付或超时未支付)。注意:队列TTL和消息TTL的区别。
-
Git作为当今最流行的分布式版本控制系统,已经成为开发者必备的技能之一。无论你是独立开发者还是团队协作,掌握Git的基本操作都能极大提高工作效率。本文将详细介绍Git的常用命令,帮助你快速上手并精通Git的基本使用。

-
-
-
-
-
-
甲骨文承诺能帮助客户尽快上手员工健康和安全管理解决方案,提供相关的白皮书,在其中列出配置基本安全事件报告的详细步骤,并在整个4月为客户提供线上支持服务,协助客户完成配置工作。
-
当企业通过上云实现转型时,迁移是一个重要的无法回避的话题。 迁移是为了提高企业信息架构和应用的敏捷性,从而助力企业快速创新和发展;迁移也是为了提高企业全球化和数字化的水平。我们从正在进行转型的公司中看到,通过云迁移实现架构和应用的现代化,主要有四个大趋势。
-
就在不久前,Mobvista刚刚发布了2019年的财报数据。我们观察到其程序化广告收入已高达22.3亿元,同比增长40.8%;经调整后EBITDA达3.6亿元,同比增长高达19.5%……试想仅仅上市一年,Mobvista在增长放缓的大环境下依然能够取得如此“高光时刻”,可见其发展势头不容小觑。
-
-
近年来,我国文化产业蓬勃发展,文化产业价值年均增速远高于同期 GDP 增速,尽管中 国演出市场在开放竞争中逐步规范有序,但目前仍处于起步和培育阶段,尚不够完善和成熟。尤其在演出场馆基础设施、管理运营等方面参差不齐。
-
Apache Kafka 是一个快速、可扩展的、高吞吐的、可容错的分布式“发布-订阅”消息系统, 使用 Scala 与 Java 语言编写,能够将消息从一个端点传递到另一个端点。
-
要想理解持续集成和持续部署,先要了解它的部分组成,以及各个组成部分之间的关系。下面这张图是我见过的最简洁、清晰的持续部署和集成的关系图。
-
数据库是应用及计算机的核心元素,负责存储运行软件应用所需的一切重要数据。为了保障应用正常运行,总有一个甚至多个数据库在默默运作。我们可以把数据库视为信息仓库,以结构化的方式存储了大量的相关信息,并合理分类,方便搜索及使用。
-
Spark3.0发布了,代码拉过来,打个包,跑起来!| 附源码编译
Spark3.0已经发布有一阵子了,官方发布了预览版,带来了一大波更新,对于我们程序员来说,首先当然是代码拉过来,打个包,跑起来!!
-
提到MySQL的事务,我相信对MySQL有了解的同学都能聊上几句,无论是面试求职,还是日常开发,MySQL的事务都跟我们息息相关。
-
从代码到 Docker、Kubernetes、Istio、Knative……,或许是时候重新思考从代码到云的编程了...
早些时候,开发人员只需编写程序、构建,然后运行。如今,开发人员还需要考虑各种运行方式,作为可执行文件在机器上运行(很有可能是虚拟机),还是打包到容器中;将容器部署到Kubernetes中,还是部署到serverless的环境中或服务网格中。然而,这些部署方式并不是开发人员编程经验的一部分。开发人员必须以某种方式编写代码才能在特定的执行环境中正常工作,因此编程时不考虑这些问题是不行的。
-
最近,安全圈又有一个大新闻,微博名为@安全_云舒的微博用户在发文称:“很多人的手机号码泄露了,根据微博账号就能查到手机号……已经有人通过微博泄露查到我的手机号码,来加我微信了。”