Blog

Technical exploration and thoughts · 655 articles

All big-data java ai artificial-intelligence programmer-life machine-learning mysql data-engineering backend distributed data-warehouse flink architecture python robotics spark hive llm distributed-system kafka database scala embodied-ai hdfs deep-learning spring message-queue langchain system-architecture mybatis performance-optimization elasticsearch mongodb health redis spring-boot rabbitmq mq hadoop elk flume stream-processing transaction messaging rpc tutorial sklearn caching cache dubbo java-rabbitmq clickhouse hbase kylin neo4j microservices sql index tomcat programmer multimodal zookeeper druid canal mllib orm ioc nutrition large-model robot-arm tesla indie-dev nginx datax sharding shardingsphere fastdfs rocketmq time-management applications career-growth docker etl guava java-rocketmq optimization learning quantization deployment kudu logstash decision-tree sqoop airflow realtime-warehouse mycat storage-engine consistency fat-loss gpt product-manager coffee business-analysis automation algorithm career-and-growth middleware computer-vision autonomous-driving fsd qwen mapreduce crud monitoring database-sharding distributed-transaction concurrency transaction-pitfalls graph-database memcached netty innodb salary career-development cold-shower running efficiency luckin industry medical industrial lfp lfp-battery battery ev fitness career-personal-growth ocr deepseek deepseek-ocr omni cloud-native yarn datastream jdbc olap knn linear-regression numpy zipper-table griffin devops kubernetes data-mapping design-patterns high-availability read-write-separation sharding-jdbc saga security replica-set cql source-code-analysis evcache servlet aop load-balancing handwritten nio mindfulness meditation exercise reinforcement-learning agent conflict evaluation money-management consumption savings social-media dating memory price-war cotti ptq qat qlora qwen2.5-vl multivitamin calcium evolution technology industrial-robot agriculture hardware simulation ros large-language-model degradation slam visual-inspection programming-language linux window raft kibana aggregation regularization logistic-regression prometheus exporter atlas state-management maven acid annotation-development master-slave-replication flexible-transaction xa cap 2pc 3pc bson explain b+tree slow-query authentication cluster oss aliyun source-code async netflix jms paxos rmi engineering physiology hot-shower practical-guide muscle-building transformer tensorflow reports technical-sharing product entrepreneurship methodology team-collaboration conflict-resolution collaboration gtd tools usage-time health-management china-us culture marriage partner coffee-beverage-trend homemade-coffee taste performance fine-tuning blip-2 minigpt-4 llava alibaba vitamins fish-oil vitamin-c iron folate chronic-disease supplements traditional-chinese-medicine western-medicine integrated-medicine development-history tech-evolution lakehouse data-mesh serverless talent tech-selection history unimate hydraulic-drive ai-collaboration categories service-robot humanoid-robot logistics career skills trends service scara cobot motor reducer sensor plc mpc control trajectory-planning vision core-technology perception decision-making home data market challenges commercialization future-trends meta-learning lifestyle nmc-battery body-fat-percentage body-shaping muscle-gain strength-training body-fat metabolism sympathetic-nerve parasympathetic-nerve autonomic-nervous-system hrv testing-platform api-integration automotive 3d model-y open-source imitation-learning visual-algorithms research java-21 kotlin golang rust javascript node k8s gemini cep source sink dataset mergetree ik-analyzer dsl term-query filter inverted-index nrt grok filebeat tez data-mining cross-validation normalization evaluation-metrics ridge-regression lasso gradient-descent grafana visualization ods scd dimension-table dwd dws ads realtime memory-management parallelism harbor container esp32 home-assistant jenkins gitlab cicd essay website astro frontend xml-mapping dynamic-sql sqlsession high-concurrency mha failover distributed-primary-key scaling binding-tables sql-optimization binding-table tcc seata data-masking distributed-database sharding-proxy sharding-strategy e-r-sharding configuration-file transaction-isolation-level schema.xml propagation declarative-transaction programmatic-transaction transactional plugin database-operations nosql json pipeline pagination writeconcern pagehelper generic-mapper b-tree use-cases selection-guide template repository wiredtiger inmemory containerization data-modeling embedded reference oplog election permissions sharded-cluster graph-theory euler-path proxy-pattern embedded-database backup access-control dynamic-proxy cloud-storage lru concurrenthashmap oom distributed-cache spymemcached activemq blockingqueue message-storage queue-index erlang handwritten-framework jdk reverse-proxy process configuration class-loading ssl jvm io heartbeat-detection spi routing storage-structure undo redo thread-model tablespace binlog replication clustered-index lock mvcc sorting pip offline pandas voice

AI Research #121: DeepSeek-OCR Research Directions

Frontier approaches and engineering implementation for DeepSeek-OCR (2025, including 3B parameter direction). Summarizes research directions including...

11/5/2025

ocrartificial-intelligencedeep-learningmachine-learningaiDeepSeekDeepSeek-OCR

AI Research #119: DeepSeek-OCR PyTorch FlashAttn 2.7.3 In...

Comprehensive guide for DeepSeek-OCR local/private deployment based on Python 3.12, PyTorch 2.6.0, Transformers 4.46.3 and FlashAttention 2.7.3. Includes ~3B parameter model inference, deployment o...

11/4/2025

ocrdeep-learningartificial-intelligenceDeepSeekDeepSeek-OCRmachine-learningai

AI Research #120: DeepSeek-OCR from 0 to 1 - Getting Star...

Complete getting started path and engineering essentials for DeepSeek-OCR (as of 2025), covering environment setup (Python/PyTorch 2.x, Transformers 4.x), model loading, output parsing, parameter e...

11/4/2025

artificial-intelligenceocrdeep-learningmachine-learningaiDeepSeekDeepSeek-OCR

AI Research #118: Embodied AI Mobile-ALOHA - Mobile + Dua...

Mobile-ALOHA: An open-source mobile manipulation solution combining mobile chassis and dual-arm collaboration. Uses whole-body teleoperation for low-cost...

11/3/2025

artificial-intelligencelearningopen-sourceimitation-learningdeep-learningmachine-learningrobotics

AI Research #117: Tesla FSD Vision Analysis - Multi-camer...

Detailed analysis of Tesla's 3D rendering (Occupancy Network): multi-camera spatiotemporal fusion → voxel occupancy → bird's eye coordinates. Explains why it...

11/1/2025

artificial-intelligence3dtechnologyteslaModel Ycomputer-visionvisual-inspection

AI Research #116: Tesla HW3.0 vs HW4.0 - Camera Resolutio...

Comprehensive comparison of Tesla HW3.0 and HW4.0 hardware: camera resolution upgraded from 1.2MP to 5MP with better HDR/night vision; FSD computing power...

10/31/2025

artificial-intelligencecomputer-visionautomotiveautonomous-drivingtesladeep-learningvisual-inspection

AI Investigation #108: Complete Robot Model Training Proc...

Full robot training pipeline: pre-training, fine-tuning (LoRA), reinforcement learning, imitation learning, and human feedback for safe autonomous decision-making.

10/20/2025

artificial-intelligenceroboticsembodied-aideep-learningreinforcement-learningmachine-learningsystem-architecture

AI Investigation #107: RL and Robot Training Data Format ...

Data formats and development processes in robot and reinforcement learning systems, including time series trajectories, state-action pairs, offline RL data,...

10/18/2025

artificial-intelligenceroboticsembodied-aiaideep-learningmachine-learningsystem-architecture

AI Investigation #106: Robot Learning Data Collection Too...

Core data collection methods and application scenarios, covering over ten methods from manual entry, sensor collection, web crawlers, API calls, log collection...

10/17/2025

artificial-intelligenceroboticsembodied-aideep-learningmachine-learningsystem-architectureai

AI Investigation #105: Robot Learning Data Collection - F...

Data collection is a critical step in robot learning development, covering demonstration video collection, trajectory recording, state-action pair generation, and data quality control strategies.

10/16/2025

artificial-intelligenceroboticsembodied-aideep-learningmachine-learningaisystem-architecture

AI Investigation #104: From Model Training to Robot Deplo...

AI model deployment optimization guide: ONNX conversion, TensorRT/OpenVINO inference engines, quantization (FP16/INT8), and real-time robotics applications.

10/15/2025

artificial-intelligenceroboticsembodied-aiaigpttensorflowperformance-optimization

AI Investigation #103: Embodied AI Technology Landscape

Comprehensive overview of embodied AI tech stack: hardware (GPU, sensors, actuators), software (ROS, simulation), and algorithms (deep learning, RL, VLA models).

10/14/2025

artificial-intelligencedeep-learningroboticsembodied-aiAIsystem-architecturemachine-learning

AI Investigation #102: Intelligent Robotic Arms, Autonomo...

Different types of robots have huge differences in structure, tasks and control methods, so AI algorithm adaptation strategies also need to be tailored.

10/13/2025

artificial-intelligenceembodied-aiairoboticsdeep-learningreinforcement-learningmachine-learning

AI Investigation #101: Modern AI Methods - VLA, RT-1, RT-...

Modern AI robot control methods are undergoing a major transition from reinforcement learning and imitation learning to multimodal agents driven by large models. The combination of Vision-Language-...

10/12/2025

artificial-intelligenceroboticsembodied-aiaigptdeep-learningmachine-learning

AI Investigation #100: Modern AI Methods - Reinforcement ...

Modern AI methods for robot control cover Reinforcement Learning (RL), Imitation Learning (IL), and Transformer-based large model methods. Reinforcement...

10/11/2025

artificial-intelligencelearningtransformerembodied-airoboticsdeep-learningmachine-learning

AI Investigation #99: Sensor Fusion Technology - Camera, ...

Sensor Fusion is a core technology in autonomous driving, robotics and smart security. Through multi-sensor data fusion of cameras, LiDAR, radar, IMU,...

10/10/2025

artificial-intelligenceembodied-aiairoboticsdeep-learningmachine-learningsystem-architecture

AI Investigation #98: Visual SLAM - ORB-SLAM, RTAB-Map, V...

Visual SLAM is a technology that achieves autonomous positioning and environment mapping without relying on LiDAR, using only cameras. By extracting environmental features (corners, edges, textures...

10/9/2025

artificial-intelligenceairoboticsembodied-aideep-learningmachine-learningSLAM

AI Investigation #97: SLAM Algorithm Comparison and Appli...

Multi-sensor fusion and SLAM are core technologies for robot perception and navigation. By fusing IMU, GPS, wheel odometry, LiDAR, visual odometry and other...

10/8/2025

artificial-intelligencealgorithmdeep-learningmachine-learningembodied-aiSLAMrobotics

AI Investigation #96: Robot Scenario Testing - From Extre...

Complete guide to robot scenario testing, covering three dimensions: environment testing, load testing, and anomaly testing. Traditional manual testing has...

10/7/2025

artificial-intelligenceembodied-aideep-learningmachine-learningaiarchitecturesystem-architecture

AI Investigation #95: Robot Scenario Testing - From Extre...

Before robots enter practical applications, systematic scenario testing must be conducted, covering boundary conditions like extreme weather, complex terrain,...

10/5/2025

artificial-intelligenceroboticsautomationembodied-aiaideep-learningmachine-learning