Blog

Technical exploration and thoughts · 655 articles

All big-data java ai artificial-intelligence programmer-life machine-learning mysql data-engineering backend distributed data-warehouse flink architecture python robotics spark hive llm distributed-system kafka database scala embodied-ai hdfs deep-learning spring message-queue langchain system-architecture mybatis performance-optimization elasticsearch mongodb health redis spring-boot rabbitmq mq hadoop elk flume stream-processing transaction messaging rpc tutorial sklearn caching cache dubbo java-rabbitmq clickhouse hbase kylin neo4j microservices sql index tomcat programmer multimodal zookeeper druid canal mllib orm ioc nutrition large-model robot-arm tesla indie-dev nginx datax sharding shardingsphere fastdfs rocketmq time-management applications career-growth docker etl guava java-rocketmq optimization learning quantization deployment kudu logstash decision-tree sqoop airflow realtime-warehouse mycat storage-engine consistency fat-loss gpt product-manager coffee business-analysis automation algorithm career-and-growth middleware computer-vision autonomous-driving fsd qwen mapreduce crud monitoring database-sharding distributed-transaction concurrency transaction-pitfalls graph-database memcached netty innodb salary career-development cold-shower running efficiency luckin industry medical industrial lfp lfp-battery battery ev fitness career-personal-growth ocr deepseek deepseek-ocr omni cloud-native yarn datastream jdbc olap knn linear-regression numpy zipper-table griffin devops kubernetes data-mapping design-patterns high-availability read-write-separation sharding-jdbc saga security replica-set cql source-code-analysis evcache servlet aop load-balancing handwritten nio mindfulness meditation exercise reinforcement-learning agent conflict evaluation money-management consumption savings social-media dating memory price-war cotti ptq qat qlora qwen2.5-vl multivitamin calcium evolution technology industrial-robot agriculture hardware simulation ros large-language-model degradation slam visual-inspection programming-language linux window raft kibana aggregation regularization logistic-regression prometheus exporter atlas state-management maven acid annotation-development master-slave-replication flexible-transaction xa cap 2pc 3pc bson explain b+tree slow-query authentication cluster oss aliyun source-code async netflix jms paxos rmi engineering physiology hot-shower practical-guide muscle-building transformer tensorflow reports technical-sharing product entrepreneurship methodology team-collaboration conflict-resolution collaboration gtd tools usage-time health-management china-us culture marriage partner coffee-beverage-trend homemade-coffee taste performance fine-tuning blip-2 minigpt-4 llava alibaba vitamins fish-oil vitamin-c iron folate chronic-disease supplements traditional-chinese-medicine western-medicine integrated-medicine development-history tech-evolution lakehouse data-mesh serverless talent tech-selection history unimate hydraulic-drive ai-collaboration categories service-robot humanoid-robot logistics career skills trends service scara cobot motor reducer sensor plc mpc control trajectory-planning vision core-technology perception decision-making home data market challenges commercialization future-trends meta-learning lifestyle nmc-battery body-fat-percentage body-shaping muscle-gain strength-training body-fat metabolism sympathetic-nerve parasympathetic-nerve autonomic-nervous-system hrv testing-platform api-integration automotive 3d model-y open-source imitation-learning visual-algorithms research java-21 kotlin golang rust javascript node k8s gemini cep source sink dataset mergetree ik-analyzer dsl term-query filter inverted-index nrt grok filebeat tez data-mining cross-validation normalization evaluation-metrics ridge-regression lasso gradient-descent grafana visualization ods scd dimension-table dwd dws ads realtime memory-management parallelism harbor container esp32 home-assistant jenkins gitlab cicd essay website astro frontend xml-mapping dynamic-sql sqlsession high-concurrency mha failover distributed-primary-key scaling binding-tables sql-optimization binding-table tcc seata data-masking distributed-database sharding-proxy sharding-strategy e-r-sharding configuration-file transaction-isolation-level schema.xml propagation declarative-transaction programmatic-transaction transactional plugin database-operations nosql json pipeline pagination writeconcern pagehelper generic-mapper b-tree use-cases selection-guide template repository wiredtiger inmemory containerization data-modeling embedded reference oplog election permissions sharded-cluster graph-theory euler-path proxy-pattern embedded-database backup access-control dynamic-proxy cloud-storage lru concurrenthashmap oom distributed-cache spymemcached activemq blockingqueue message-storage queue-index erlang handwritten-framework jdk reverse-proxy process configuration class-loading ssl jvm io heartbeat-detection spi routing storage-structure undo redo thread-model tablespace binlog replication clustered-index lock mvcc sorting pip offline pandas voice

Offline Data Warehouse: Hive ODS Layer Table Creation and...

Sync MySQL data to specified HDFS directory via DataX, then create ODS external tables in Hive with unified dt string partitioning. Enables fast queries of raw transaction records within 7 days, de...

12/7/2024

big-datadata-warehousehiveods

Offline Data Warehouse: E-commerce Core Transaction Incre...

Using DataX (MySQLReader + HDFSWriter) to extract daily incremental data from MySQL order tables, order detail tables, and product information tables into...

12/6/2024

big-datadata-warehousedataxhdfshive

MyBatis Design Patterns - Proxy Pattern and Source Code A...

Detailed introduction to proxy design pattern concepts, classifications, and their manifestation in MyBatis, including static and dynamic proxy code implementation and MapperProxy source code analy...

12/6/2024

JavaMyBatisDesign PatternsProxy Pattern

Neo4j + Spring Boot Practice: Integration from Driver to ...

Complete guide to integrating Spring Boot with Neo4j: Java Driver, Neo4jTemplate, Repository pattern with practical examples for graph database CRUD operations and relationship queries.

12/5/2024

JavaNeo4jSpring Boot

MyBatis Design Patterns - Builder Pattern, Factory Patter...

Detailed introduction to design patterns used in MyBatis source code including builder pattern, factory method pattern, singleton pattern, proxy pattern, composite pattern, and their manifestation ...

12/5/2024

JavaMyBatisDesign PatternsSource Code Analysis

Offline Data Warehouse Practice: E-commerce Core Transact...

Focusing on three main metrics: order count, product count, payment amount, breakdown analysis dimensions by sales region and product type (3-level category).

12/4/2024

big-datadata-warehousehivemysql

Flink State and Checkpoint: State Management, Fault Toler...

Flink stateful computation explanation: Keyed State, Operator State, Checkpoint configuration, Savepoint backup and recovery, production environment practices.

12/4/2024

big-dataflinkstream-processingdata-engineering

Offline Data Warehouse Advertising Business Hive ADS Prac...

Complete solution for exporting Hive ADS layer data to MySQL using DataX. Covers ADS loading, DataX configuration, MySQL table creation, Shell script parameterized execution, and common error diagn...

12/3/2024

big-datadata-warehousehivehdfsdataxmysql

Neo4j Access Modes: Embedded vs Server with Java Examples

Neo4j embedded database vs server mode comparison, Java API access examples. This article deeply analyzes principles and practical applications.

12/3/2024

JavaNeo4jEmbedded Database

Offline Data Warehouse Advertising Business: Flume Import...

Using Flume Agent to collect event logs and write to HDFS, then use Hive scripts to complete ODS and DWD layer data loading by date. Content covers Flume Agent's Source, Channel, Sink basic structu...

12/2/2024

big-datadata-warehousehivehdfsflume

Neo4j Backup/Recovery + Warm-up and Execution Plan Practice

Neo4j database backup and recovery, data warm-up and execution plan analysis. This article deeply analyzes principles and practical applications.

12/1/2024

JavaNeo4jBackupPerformance Optimization

Offline Data Warehouse Advertising Business Hive Analysis...

Implementation of advertising impression, click, purchase hourly statistics based on Hive offline data warehouse, completing CTR, CVR and advertising effect...

11/30/2024

big-datadata-warehousehivehdfs

Flink Streaming Introduction: DataStream API & Program St...

Flink DataStream API getting started guide, program execution flow, environment acquisition, data source definition, operator chaining and execution mode details, demonstrating stream processing pr...

11/30/2024

big-dataflinkstream-processingdata-engineering

Flink Window and Watermark: Time Windows, Tumbling/Slidin...

Comprehensive analysis of Flink Window mechanism: tumbling windows, sliding windows, session windows, Watermark principle and generation strategies, late data processing mechanism.

11/30/2024

big-dataflinkstream-processingdata-engineering

Offline Data Warehouse Hive Advertising Business Practice...

Hive offline data warehouse advertising business practice, combined with typical pipeline of Flume + Hive + UDF + Parquet, demonstrates how to map raw event...

11/29/2024

big-datadata-warehousehivehdfsflume

Offline Data Warehouse Member Metrics Verification, DataX...

Offline data warehouse practice based on Hadoop + Hive + HDFS + DataX + MySQL, covering member metrics testing (active/new/retention), HDFS export, DataX sync to MySQL, and advertising business ODS...

11/28/2024

big-datadata-warehousehivehdfsdataxmysql

Neo4j Transaction, Index and Constraint Practice: Syntax,...

Neo4j transaction handling, index creation, constraint settings and concurrency issue troubleshooting. This article deeply analyzes principles and practical applications.

11/28/2024

JavaNeo4jIndexTransaction

Offline Data Warehouse Practice: Flume+HDFS+Hive Building...

Demonstrates a complete pipeline from log collection to member metric analysis, covering Flume Taildir monitoring, HDFS partition storage, Hive external table loading, ODS/DWD/DWS/ADS layered proce...

11/27/2024

big-datadata-warehousehivehdfsflume

Flink Installation & Deployment: Local, Standalone, YARN ...

Complete tutorial for Apache Flink installation and deployment in three modes: Local, Standalone cluster, and YARN integration, including environment configuration, parameter tuning, and common iss...

11/27/2024

big-dataflinkdata-engineering

Flink on YARN Deployment: Environment Preparation, Resour...

Detailed explanation of three Flink deployment modes on YARN cluster: Session, Application, Per-Job modes, Hadoop dependency configuration, YARN resource application and job submission process.

11/27/2024

big-dataflinkdistributed-systemdata-engineering