博客

记录技术探索与思考 · 共 655 篇

全部 big-datajavaaiartificial-intelligenceprogrammer-lifemachine-learningmysqldata-engineering后端flinkdistributedarchitecturepythondata-warehouseroboticssparkhivekafkascaladistributed-systemllm数据库hdfsembodied-aideep-learningspring消息队列langchainsystem-architecturemybatisperformance-optimizationelasticsearchmongodbhealthredisspring-bootrabbitmqmqhadoopelkflumestream-processing事务hbasemessagingrpc教程sklearncachinglarge-language-model缓存dubbojava-rabbitmqclickhousekylinmllibneo4jsqlrealtime-warehousecanal索引微服务tomcatprogrammermultimodalteslazookeeperdruiddataxormshardingsphereiocnutritionrobot-armindie-devnginxfastdfsrocketmqtime-managementapplicationscareer-growthetlguavajava-rocketmq优化learningquantizationmiddlewaredockerkudulogstashdecision-treesqoopairflow分库分表分片mycat存储引擎一致性fat-lossgptproduct-managercoffeebusiness-analysisautomationalgorithmcareer-and-growthcomputer-visionautonomous-drivingfsdqwenmapreducecrudbackend分布式事务并发事务失效图数据库memcachednettyinnodbsalarycareer-developmentcold-showerrunningproductivityluckinmedicalindustriallfplfp-batterybatteryevfitnesscareer-personal-growthocrdeepseekdeepseek-ocrprogramming-languagecloud-nativeyarndatastreamjdbcolapknnlinear-regressionnumpymonitoringgriffin设计模式数据映射读写分离主从复制高可用安全源码分析cqlevcacheservletaop负载均衡手写niomindfulnessmeditationexercisemuscle-gainreinforcement-learningagentconflictevaluationmoney-managementconsumptionsocial-mediadatingmemoryprice-warcottiptqqatqloraqwen2.5-vlmulti-dimensionalhistoryindustrial-robotagriculturehardwaresimulationsectorrosdeploymentslamvisual-inspectionlinuxwindowraftkibanaregularizationlogistic-regressionprometheusexporterzipper-tableatlasstate-managementdevopsservermaven注解开发sharding-jdbccap2pc3pcxasagaacidbsonexplain慢查询副本集部署认证集群oss阿里云源码netflix异步jmspaxosrmiengineeringphysiologyhot-showerpractical-guidetransformertensorflowreporttech-sharingproductstartupmethodologyteamworkconflict-resolutioncollaborationgtdtoolsdepositsavingsscreen-timehealth-managementchina-usculturemarriagepartnercoffee-beveragehomemade-coffeetasteperformancefine-tuningblip-2minigpt-4llavaalibabavitaminsfish-oilcalcium-supplementvitamin-cironcalciumfolic-acidchronic-diseasesupplementstcmwestern-medicineintegrative-medicineevolution-techtech-evolutionlakehousedata-meshserverlesstalentindustrytech-selectionevolutionunimatetechnologyhydraulic-driveai-collaborationclassificationservice-robothumanoid-robotlogisticscareerskillstrendsservicescaracobotmotorreducersensorplcmpccontroltrajectory-planningvisioncore-technologyperceptiondecision-makingfamilydatamarketchallengescommercializationfuture-trendsmeta-learninglifestylenmc-batterydegradationbody-fat-percentagebody-shapingstrength-trainingbody-fatmetabolismsympathetic-nerveparasympathetic-nerveautonomic-nervous-systemhrvtesting-platformapi-integrationautomotive3dtechmodel-yopen-sourceimitation-learningvision-algorithmominomni-modalomniresearchjava-21kotlingolangrustjavascriptnodek8sgeminicepsourcesinkdatasetmergetreeik-analyzerdslterm-queryfilteraggregationinverted-indexnrtgrokfilebeattezdata-miningcross-validationnormalizationevaluation-metricsridge-regressionlassogradient-descentgrafanavisualizationodsscddimension-tabledwddwsadsmemory-managementparallelismcontaineresp32home-assistantjenkinsgitlabcicddevops-devessaywebsiteastrofrontendxml映射sqlsession动态sqlmha故障切换高并发分布式主键扩容绑定表sql优化hint强制路由数据脱敏tccseata柔性事务sharding-proxy分布式数据库分片策略e-r分片配置文件schema.xml事务隔离级别transactional声明式事务编程式事务传播机制插件nosqljson数据库操作分页writeconcern聚合pipelinepagehelper通用mapperb树b+树应用场景选型templaterepository数据建模内嵌引用wiredtigerinmemory复制集oplog选举容器化sharding分片集群权限图论欧拉路径动态代理备份嵌入式数据库分布式文件系统云存储权限控制concurrenthashmaplruoom代理模式分布式缓存spymemcachedblockingqueueactivemq手写框架消息存储队列索引erlangjdk反向代理进程配置类加载ssljvm心跳检测io监控spi路由降级表空间线程模型存储结构undoredobinlogb+tree聚簇索引排序mvcckubernetesoffline-installpandaspipmicroservicesvoice

FastDFS 架构实战:轻量 Tracker、对等存储与上传/同步原理全解

FastDFS 架构设计理念:轻量级 Tracker、对等存储结构、文件上传与同步原理。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-250 离线数仓 - ADS层 与 Airflow 任务调度系统

Apache Airflow 是一个开源的任务调度和工作流管理平台,主要用于开发、调试和监控数据管道。Airflow 通过使用 Python 脚本定义任务和依赖关系,帮助用户以编程的方式构建动态的、可视化的工作流。

大数据-96 Flink 广播状态:Broadcast State 实战与规则更新

Flink 广播状态详解:BroadcastState 原理、动态规则更新、状态分区与内存管理,通过案例演示广播流与非广播流 join。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-97 Flink State Backend:状态存储与性能优化

Flink State Backend 详解:HashMapStateBackend、EmbeddedRocksDBStateBackend 选型,内存配置与性能调优。

实现简易IoC-02:无IoC与AOP场景下实现业务

在没有使用Spring的情况下,手动实现业务逻辑分层,包括DAO层、Service层和Controller层,展示传统开发方式的依赖管理问题。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-249 离线数仓 - DWD层建表与脚本 DWS层建表与脚本

订单表是周期性事实表,为保留订单状态可使用拉链表处理;订单产品表为普通事实表。订单状态包括:-3用户拒收、-2未付款订单、-1用户取消、0等待发货、1配送中、2用户确认收货。订单从创建到完成有时间限制,业务上不允许订单一个月后状态仍变化。

实现简易IoC-01:Servlet介绍与基本代码编写

手把手教你实现简易Spring IoC容器,第一部分介绍Servlet的基本概念、特点和工作原理,并编写第一个Servlet程序。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-248 离线数仓 - 维表:商品分类表、地域组织表、商品信息表

文章首先确定事实表与维表的区分:绿色表示事实表,灰色表示维表。维表处理方式根据数据量选择不同策略——小表采用每日快照表(如产品分类表、商家店铺表、商家地域组织表、支付方式表),大表则使用拉链表(如产品信息表)。由于数据库遵循三范式导致查询不便,文章通过逆规范化设计,将商品分类维度表、省份区域维度表和商家信息维度表进行处理,生成宽表以简化查询逻辑。

FastDFS 架构详解:Storage/Tracker/Group 设计与实战

FastDFS 核心架构详解:Tracker Server、Storage Server、Group 分组机制。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

Spring概述:发展历史与核心思想IoC、AOP

全面介绍Spring框架的基本概念、发展历程,从EJB到Spring的演进,详细讲解Spring的核心思想IoC控制反转和AOP面向切面编程。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-247 离线数仓 - Hive 拉链表实战:订单历史状态增量刷新

Hive 拉链表实战教程,讲解订单历史状态增量刷新、ODS 到 DWD 分层,结合 2020 年订单状态变更案例,说明拉链表如何处理"记录会变化、又需要保留历史"的业务对象。

手写ORM框架4:框架优化与DefaultSqlSession代理实现

对手写ORM框架进行优化,重点讲解DefaultSqlSession中getMapper方法的实现,利用JDK动态代理创建Mapper接口的代理对象。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-246 离线数仓 - Hive 拉链表实战:初始化、增量更新、回滚脚本

文章浏览阅读5.2k次,点赞37次,收藏15次。离线数仓建模方式,实战讲解 Hive 拉链表实现方案,覆盖初始化装载、每日增量更新、历史版本闭链、Shell 调度脚本以及回滚恢复逻辑。

FastDFS 6.15.0+Nginx 动态模块实战:源码编译到访问,从0到1详细配置流程

FastDFS 6.15.0 源码编译安装与 Nginx fastdfs-nginx-module 配置完整指南。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

手写ORM框架3:SqlSession、Executor工作原理详解

深入剖析手写ORM框架中SqlSession和Executor的工作原理,详细讲解SqlSessionFactoryBuilder、DefaultSqlSession、SimpleExecutor的实现机制。

大数据-245 离线数仓 - Hive 拉链表入门实战:缓慢变化维 SCD 类型、建表加载

文章浏览阅读5.2k次,点赞39次,收藏23次。缓慢变化维(SCD,Slowly Changing Dimensions)展开,系统梳理 SCD Type 0、1、2、3、4、6 的核心差异,并结合 Hive 离线数仓场景说明快照表与拉链表的适用边界。

手写ORM框架2:Resources、MappedStatement、XMLBuilder实现

本文手把手教你手写ORM框架,详细介绍Resources、MappedStatement、XMLBuilder等核心组件的实现,包括配置文件解析、映射文件处理等关键步骤。

FastDFS 从单机到分布式文件存储:实战与架构取舍

FastDFS 分布式文件系统架构详解,从单机到分布式的演进路径。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

深入浅出 MyBatis - 手写ORM框架1 测试JDBC问题 解决方案

手写ORM框架系列第一篇,介绍传统JDBC开发的问题和缺点,以及ORM框架的设计思路和解决方案。本文深入分析原理与实践应用,帮助读者全面理解核心技术要点。

大数据-244 离线数仓 - Hive ODS 层建表与分区加载实战

通过 DataX 将 MySQL 数据同步到 HDFS 指定目录,再在 Hive 中创建 ODS 外部表,统一使用 dt 字符串分区。允许在7天内快速查询原始交易记录体现ods层什么核心特点。