博客

记录技术探索与思考 · 共 655 篇

全部 big-data java ai artificial-intelligence programmer-life machine-learning mysql data-engineering 后端 flink distributed architecture python data-warehouse robotics spark hive kafka scala distributed-system llm 数据库 hdfs embodied-ai deep-learning spring 消息队列 langchain system-architecture mybatis performance-optimization elasticsearch mongodb health redis spring-boot rabbitmq mq hadoop elk flume stream-processing 事务 hbase messaging rpc 教程 sklearn caching large-language-model 缓存 dubbo java-rabbitmq clickhouse kylin mllib neo4j sql realtime-warehouse canal 索引微服务 tomcat programmer multimodal tesla zookeeper druid datax orm shardingsphere ioc nutrition robot-arm indie-dev nginx fastdfs rocketmq time-management applications career-growth etl guava java-rocketmq 优化 learning quantization middleware docker kudu logstash decision-tree sqoop airflow 分库分表分片 mycat 存储引擎一致性 fat-loss gpt product-manager coffee business-analysis automation algorithm career-and-growth computer-vision autonomous-driving fsd qwen mapreduce crud backend 分布式事务并发事务失效图数据库 memcached netty innodb salary career-development cold-shower running productivity luckin medical industrial lfp lfp-battery battery ev fitness career-personal-growth ocr deepseek deepseek-ocr programming-language cloud-native yarn datastream jdbc olap knn linear-regression numpy monitoring griffin 设计模式数据映射读写分离主从复制高可用安全源码分析 cql evcache servlet aop 负载均衡手写 nio mindfulness meditation exercise muscle-gain reinforcement-learning agent conflict evaluation money-management consumption social-media dating memory price-war cotti ptq qat qlora qwen2.5-vl multi-dimensional history industrial-robot agriculture hardware simulation sector ros deployment slam visual-inspection linux window raft kibana regularization logistic-regression prometheus exporter zipper-table atlas state-management devops server maven 注解开发 sharding-jdbc cap 2pc 3pc xa saga acid bson explain 慢查询副本集部署认证集群 oss 阿里云源码 netflix 异步 jms paxos rmi engineering physiology hot-shower practical-guide transformer tensorflow report tech-sharing product startup methodology teamwork conflict-resolution collaboration gtd tools deposit savings screen-time health-management china-us culture marriage partner coffee-beverage homemade-coffee taste performance fine-tuning blip-2 minigpt-4 llava alibaba vitamins fish-oil calcium-supplement vitamin-c iron calcium folic-acid chronic-disease supplements tcm western-medicine integrative-medicine evolution-tech tech-evolution lakehouse data-mesh serverless talent industry tech-selection evolution unimate technology hydraulic-drive ai-collaboration classification service-robot humanoid-robot logistics career skills trends service scara cobot motor reducer sensor plc mpc control trajectory-planning vision core-technology perception decision-making family data market challenges commercialization future-trends meta-learning lifestyle nmc-battery degradation body-fat-percentage body-shaping strength-training body-fat metabolism sympathetic-nerve parasympathetic-nerve autonomic-nervous-system hrv testing-platform api-integration automotive 3d tech model-y open-source imitation-learning vision-algorithm omin omni-modal omni research java-21 kotlin golang rust javascript node k8s gemini cep source sink dataset mergetree ik-analyzer dsl term-query filter aggregation inverted-index nrt grok filebeat tez data-mining cross-validation normalization evaluation-metrics ridge-regression lasso gradient-descent grafana visualization ods scd dimension-table dwd dws ads memory-management parallelism container esp32 home-assistant jenkins gitlab cicd devops-dev essay website astro frontend xml映射 sqlsession 动态sql mha 故障切换高并发分布式主键扩容绑定表 sql优化 hint 强制路由数据脱敏 tcc seata 柔性事务 sharding-proxy 分布式数据库分片策略 e-r分片配置文件 schema.xml 事务隔离级别 transactional 声明式事务编程式事务传播机制插件 nosql json 数据库操作分页 writeconcern 聚合 pipeline pagehelper 通用mapper b树 b+树应用场景选型 template repository 数据建模内嵌引用 wiredtiger inmemory 复制集 oplog 选举容器化 sharding 分片集群权限图论欧拉路径动态代理备份嵌入式数据库分布式文件系统云存储权限控制 concurrenthashmap lru oom 代理模式分布式缓存 spymemcached blockingqueue activemq 手写框架消息存储队列索引 erlang jdk 反向代理进程配置类加载 ssl jvm 心跳检测 io 监控 spi 路由降级表空间线程模型存储结构 undo redo binlog b+tree 聚簇索引排序锁 mvcc kubernetes offline-install pandas pip microservices voice

大数据-05 Hadoop集群 WordCount 分布式计算实战

在 Hadoop 集群上完整执行 WordCount：上传文件到 HDFS、提交 MapReduce 任务、通过 YARN UI 查看运行状态，验证真正的分布式计算。

2024/7/1

big-datahadoopmapreducehdfs

大数据-06 Hadoop JobHistoryServer 配置与日志聚合

配置 Hadoop JobHistoryServer 记录 MapReduce 任务执行历史，开启 YARN 日志聚合，通过 Web UI 可视化查看任务详情和日志。

2024/7/1

big-datahadoopmapreduceyarn

大数据-03 Hadoop集群 SSH免密登录配置与分发脚本

Hadoop 三节点集群 SSH 免密登录全流程：生成 RSA 密钥、分发公钥、编写 rsync 集群分发脚本，含踩坑笔记与 /etc/hosts 配置要点。本文深入分析原理与实践应用，帮助读者全面理解核心技术要点。

2024/6/30

big-datahadooplinuxdistributed-system

大数据-04 Hadoop集群群起 NameNode DataNode YARN 启动与 Web UI 验证

Hadoop 三节点集群完整启动流程：格式化 NameNode、启动 HDFS 和 YARN，通过 Web UI 验证集群状态，含 start-dfs.sh 和 start-yarn.sh 用法。

2024/6/30

big-datahadoophdfsyarndistributed-system

大数据-01 基础环境搭建：Hadoop 集群

在3台云服务器（2C4G配置）上搭建Hadoop集群环境的详细教程，包含HDFS、MapReduce、YARN组件介绍，Java和Hadoop环境配置步骤。本文深入分析原理与实践应用，帮助读者全面理解核心技术要点。

2024/6/28

big-datahadoopjavadistributed-system

大数据-02 Hadoop集群 XML配置详解 core-site hdfs-site mapred-site y...

详解 Hadoop 集群三节点 XML 配置文件：core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml，含 NameNode、DataNode、ResourceManager 配置说明。

2024/6/28

big-datahadoophdfsdistributed-system

LangChain-26 Custom Agent 全面教程从零构建自定义智能体

本文展示了如何在Python中使用Langchain库和GPT-4模型创建一个聊天代理，通过定义工具函数并将其与LLM集成，实现对用户输入中单词长度等信息的查询。

2024/4/15

langchainllmaipython

LangChain-24 AgentExecutor 全面详解

本文介绍了如何在Python中使用Langchain库进行文档检索，加载Web内容，配置OpenAIEmbeddings，并集成GPT-3.5-turbo模型进行问答。展示了如何创建代理执行器来处理用户查询并获取相关信息。

2024/4/14

langchainllmaipython

LangChain-25 ReAct框架详解大语言模型推理与行动融合

文章介绍了大模型ReAct，一种利用逻辑推理和行动序列实现目标导向的框架，通过LLM进行决策和操作。核心组成部分包括Thought（思考）、Act（行动）和Obs（观察）。

2024/4/14

langchainllmaipython

LangChain-22 Text Embedding与FAISS实战详解

本文介绍了TextEmbedding在NLP中的关键作用，如何将文本转换为实数向量以表达语义关系，以及如何结合OpenAIEmbeddings和FAISS进行高效存储和查询。

2024/4/13

langchainllmaipython

LangChain-23 Vector AI语义检索系统向量数据库+大语言模型

文章介绍了如何使用Chroma向量数据库处理和检索来自文档的高维向量嵌入，通过OpenAI和HuggingFace模型进行向量化，并展示了在实际场景中如何通过大模型进行问答和增强回复的应用实例。

2024/4/13

langchainllmaipython

LangChain-20 文档加载器 TextLoader、CSVLoader、PyPDFLoader、JSONL...

本文介绍了LangChain库提供的多种文档加载器，如TextLoader、CSVLoader、DirectoryLoader等，展示了如何加载和处理各种格式的数据。

2024/4/12

langchainllmaipython

LangChain-21 Text Splitter 全面详解

文章浏览阅读7.5k次。本文介绍了LangChain库中的各种TextSplitters，包括基于字符、单词、HTML标签和编程语言的分割器，以及它们的应用场景。

2024/4/12

langchainllmaipython

LangChain-18 缓存机制详解 InMemoryCache与SQLiteCache

文章浏览阅读7.1k次。LangChain 提供完善的缓存机制，用于显著降低 LLM 调用延迟与成本。其核心包括 InMemoryCache（内存缓存）与 SQLiteCache（持久化缓存）。

2024/4/11

langchainllmaipython

LangChain-19 TokenUsage 回调函数详解

介绍了如何在Python中通过LangChain库集成OpenAI GPT-3模型，展示如何使用`get_openai_callback`函数来获取回调并执行请求。

2024/4/11

langchainllmaipython

LangChain-16 Using Tools 掌握 LLM 工具调用

文章浏览阅读6.1k次。LangChain 是当前最热门的 LLM 应用开发框架之一，专为构建智能助手、自动化流程和AI数据分析而设计。通过其强大的工具集成能力，开发者可轻松调用外部API，实现从搜索、计算到文件处理的多功能自动化。

2024/4/10

langchainllmaipython

LangChain-17 Function Calling AI函数调用的工作原理

Function Calling（函数调用）是大语言模型（如GPT-4、Claude、Gemini）与外部系统交互的核心技术。它让AI不仅能理解语言，还能执行任务，实现从文本对话到真实操作的跨越。

2024/4/10

langchainllmaipython

LangChain-14 OpenAI 内容审核 Moderation详解

内容审核（Moderation）是现代互联网平台安全与合规的核心环节，用于识别、过滤和管理用户生成内容（UGC），防止违法违规、低质或有害信息的传播。本文深入分析原理与实践应用，帮助读者全面理解核心技术要点。

2024/4/9

langchainllmaipython

LangChain-15 智能知识检索：AgentExecutor执行机制

文章浏览阅读7.1k次，点赞25次，收藏4次。本文介绍了如何通过Wikipedia搜索插件、AgentExecutor执行机制、上下文Token控制来构建智能知识检索系统。

2024/4/9

langchainllmaipython

LangChain-12 Routing By Semantic Similarity 语义相似度路由

文章浏览阅读6.4k次。本文介绍了一种使用大模型（如OpenAI）和Prompt模板的方法，通过计算查询与预设模板的相似度来处理程序设计中非预期输入的问题。本文深入分析原理与实践应用，帮助读者全面理解核心技术要点。

2024/4/8

langchainllmaipython

博客

大数据-05 Hadoop集群 WordCount 分布式计算实战

大数据-06 Hadoop JobHistoryServer 配置与日志聚合

大数据-03 Hadoop集群 SSH免密登录配置与分发脚本

大数据-04 Hadoop集群群起 NameNode DataNode YARN 启动与 Web UI 验证

大数据-01 基础环境搭建：Hadoop 集群

大数据-02 Hadoop集群 XML配置详解 core-site hdfs-site mapred-site y...

LangChain-26 Custom Agent 全面教程 从零构建自定义智能体

LangChain-24 AgentExecutor 全面详解

LangChain-25 ReAct框架详解 大语言模型推理与行动融合

LangChain-22 Text Embedding与FAISS实战详解

LangChain-23 Vector AI语义检索系统 向量数据库+大语言模型

LangChain-20 文档加载器 TextLoader、CSVLoader、PyPDFLoader、JSONL...

LangChain-21 Text Splitter 全面详解

LangChain-18 缓存机制详解 InMemoryCache与SQLiteCache

LangChain-19 TokenUsage 回调函数详解

LangChain-16 Using Tools 掌握 LLM 工具调用

LangChain-17 Function Calling AI函数调用的工作原理

LangChain-14 OpenAI 内容审核 Moderation详解

LangChain-15 智能知识检索：AgentExecutor执行机制

LangChain-12 Routing By Semantic Similarity 语义相似度路由

LangChain-26 Custom Agent 全面教程从零构建自定义智能体

LangChain-25 ReAct框架详解大语言模型推理与行动融合

LangChain-23 Vector AI语义检索系统向量数据库+大语言模型