博客
记录技术探索与思考 · 共 655 篇
深入浅出 MongoDB 索引详解 性能优化:慢查询分析 索引调优 快速定位并解决慢查询
MongoDB慢查询分析通过内置Profiler实现,设置db.setProfilingLevel(1, m)记录慢查询。EXPLAIN分析帮助识别性能瓶颈和优化查询。
深入浅出 MongoDB 索引详解 从 MongoDB B-树 到 MySQL B+树 索引机制、数据结构与应用场...
MongoDB采用B-树索引,节点可同时存储数据与键值;MySQL采用B+树索引,所有数据集中在叶子节点。B+树更适合范围查询,B-树更适合随机点查询。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
深入浅出 MongoDB 全面的适用场景分析与选型指南 场景应用指南
MongoDB适用于网站数据存储、缓存系统、大数据分析、物联网、社交媒体、直播平台等多种场景。不适合需要复杂事务和高度规范化的场景。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
深入浅出 MongoDB 用Java访问 MongoDB 数据库 从环境搭建到CRUD完整示例
Java访问MongoDB数据库的完整指南,包括环境搭建、Maven依赖、连接MongoDB、CRUD操作、POJO映射、索引管理、聚合查询和事务处理。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB Spring Boot 连接实战 | Template vs Repository(含索引与常见坑)
Spring Boot连接MongoDB的两种方式:MongoTemplate模板方式和MongoRepository仓库方式,含完整Java代码示例和常见问题排查。
MongoDB 内嵌、引用怎么选?逻辑结构与引擎分析
MongoDB数据建模选择内嵌还是引用,遵循三原则:一对少嵌入、增长无上限用引用、跨集合关联用$lookup+索引。WiredTiger默认即可。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 存储引擎 WiredTiger vs InMemory:何时用、怎么配、如何验证 mongod.conf
MongoDB两种主要存储引擎WiredTiger和InMemory的对比、配置方法及验证步骤。生产环境推荐使用WiredTiger。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 复制集从概念到简易实战 | oplog,心跳与选举一文读懂
MongoDB复制集认知:oplog位置与幂等性,心跳频率与选举超时、成员/投票上限(50/7),并指出4.0起移除主从复制。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 副本集容器化 10 分钟速查卡|keyfile + –auth + 幂等 init 附 docke...
MongoDB 7副本集的容器化最佳实践:生成keyfile、显式开启--auth,用一次性容器完成rs.initiate与管理员创建。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB副本集部署实战 单机三实例/多机同法 10 分钟起集群 + 选举/读写/回滚全流程
MongoDB副本集的单机三实例部署指南,包括配置、初始化、添加/移除节点、选举、读写分离和回滚操作。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 集群分片 Sharding 分片详解 最小可跑示例 片键决策 均衡迁移
MongoDB分片集群详解:分片由Shard、Config Server、Mongos组成。片键选择包括范围分片、哈希分片、区域分片。包含最小可运行示例。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 分片集群实战 万字长文超详细 | 搭建/校验/均衡/回滚(含脚本与速查卡 / 2025)
手把手搭建MongoDB分片集群(configsvr×3 + 两套shard副本集×3节点 + 多mongos),包括配置、初始化、添加分片、均衡和回滚。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 生产安全加固实战:10 分钟完成认证、最小权限、角色详解
MongoDB生产环境安全加固指南,包括认证开启、RBAC最小权限、内网bindIp/防火墙ACL、TLS/SSL加密。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
MongoDB 认证与权限实战:单实例与分片集群 整体认证配置实战 最小化授权/错误速查/回滚剧本
MongoDB认证与权限配置,从单实例到分片集群,按先建admin/root→启用authorization→按库分权的顺序落地。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
Neo4j 图论详解 欧拉路径与欧拉回路 10 分钟跑通:Python NetworkX 判定实战
欧拉路径/欧拉回路的判定:无向图看连通性与奇度顶点数,有向图看弱连通与入出度平衡。文内提供基于Python NetworkX的最小可运行示例。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
大数据-223 离线数仓怎么建:埋点→指标体系→主题分析任务,全链路落地指南
文章浏览阅读4.5k次,点赞23次,收藏27次。业务拆分(前台/运营后台/商家后台)→数据来源(启动/点击日志、下单/支付/退款等交易数据)→数据埋点(页面统计/操作统计、需求—采集—上报—清洗加工—入仓—分析—展示)→指标体系(准确/可解释/结构性、指标=基础指标+修饰词+时间段、核心指标与维度拆解、漏斗拆解与监控)。结合会员活跃、广告、核心交易三类主题分析任务,强调指标口径标准化(指标字...
大数据-224 离线数仓 架构怎么选型与估算集群规模:Apache vs CDH/HDP,全组件清单+命名规范
离线数据仓库(离线数仓)总体架构设计与落地方法:框架选型对比 Apache 社区版与第三方发行版(CDH/HDP/FusionInsight),梳理数据采集(DataX/Flume/Sqoop/Logstash/Kafka)、存储(HDFS/HBase)、计算(Hive/MapReduce/Tez/Spark/Flink)、调度(Airflow/Azkaban/Oozie)、元数据(Atla...
深入浅出 MyBatis - 二级缓存整合Redis 代码测试 与 原理探究 源码分析
详细介绍MyBatis二级缓存整合Redis的实现方法,通过分布式缓存实现跨服务共享,包含pom配置、mapper配置、测试代码和源码分析。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。
大数据-221 离线数仓分层实战:ODS/DWD/DWS/DIM/ADS 怎么划,数据集如何避免数据孤岛
文章浏览阅读4.2k次,点赞40次,收藏35次。(Offline Data Warehouse)在企业落地时最常见的两类问题:数据集市扩张导致的数据孤岛、以及数仓分层边界不清导致的重复计算与口径混乱,给出可执行的工程化拆解。你会看到数据集市(Data Mart)为何只能作为数据仓库(DW)的一部分,以及在多 BU 组织下如何通过一致性维度(DIM)与可复用的明细层(DWD)/汇总层(DWS)...
大数据-222 离线数仓建模实战:事实表/维度表、三类事实表与雪花/星座模型
文章浏览阅读5.3k次,点赞39次,收藏25次。离线数仓建模实践,系统梳理事实表(Fact Table)与维度表(Dimension Table)的核心概念、事实类型(可加/半可加/不可加)与粒度(交易/快照/累积快照)对查询性能与可分析性的决定性影响。围绕三类事实表:事务事实表、周期快照事实表、累积快照事实表,给出适用业务过程与更新机制边界,尤其强调累积快照的多里程碑日期键与"未发生"...