MQ Application: Cache Warm-up, Rate Limiting, Redis Lua, ...

TL;DR

Scenario: E-commerce seckill/ticket-grabbing scenarios with instantaneous traffic peaks, high read/write concurrency
Conclusion: Use pre-static + rate limiting queuing; write path uses Redis Lua atomic pre-deduction + MQ async persistence; read path uses multi-level cache
Output: Seckill frontend/backend implementation checklist + Kafka produce/consume examples + Lua inventory deduction script framework

Application Scenarios

E-commerce Case - High Concurrency Seckill System Response Strategy

Pre-seckill Strategy:

Page Static Processing
- Pre-generate product detail page static HTML
- Use CDN to distribute static resources
Request Rate Limiting and Queuing
- Layered rate limiting:
  - Frontend JS limits refresh frequency
  - Gateway layer limits IP requests
  - Service layer limits interface calls
Cache Warm-up
- Pre-load seckill product info into Redis cache
- Use multi-level cache architecture

Core Seckill Processing:

Inventory Deduction Optimization
- Use Redis atomic operations for pre-deduction
- Lua script guarantees atomicity
Order Processing Diversion
- Use message queue for peak cutting
- Architecture: Request → Quick Validation → MQ → Async Order Processing
Service Isolation and Degradation
- Independently deploy seckill service
- Key degradation strategy: Disable non-core features

High Concurrency Read Request Processing

1. Cache Strategy Optimization

Multi-level Cache Architecture:
- Client cache
- CDN edge node cache
- Application layer cache (Redis/Memcached)
- Database query cache

2. Data Static Processing

Fully Static: Generate HTML files hosted on CDN
Semi-static: Static template + dynamic data fragments

3. Smart Rate Limiting

Rate Limiting Dimensions: User ID, IP, device fingerprint, interface level
Rate Limiting Algorithms: Token bucket, leaky bucket, sliding window counting

High Concurrency Write Request Processing

Message Queue Solution

Traffic Peak Cutting
- Store burst 10k QPS write requests in queue
- Database consumes at its own pace (e.g., 2000 QPS)
Async Processing
- Fast Response Phase: Validate user qualification, generate pre-order, return immediately
- Async Processing Phase: Actual inventory deduction, generate formal order, notify payment system
System Decoupling
- Order service only generates order messages
- Inventory service independently consumes messages
- Payment service listens for payment messages

Kafka Implementation Example

Producer:

public void handleSeckillRequest(UserRequest request) {
    if(!validate(request)) return;
    PreOrder preOrder = createPreOrder(request);
    kafkaTemplate.send("seckill_orders", preOrder);
    return Response.success("Seckill request received");
}

Consumer:

@KafkaListener(topics = "seckill_orders")
public void processOrder(PreOrder preOrder) {
    try {
        inventoryService.reduceStock(preOrder);
        orderService.createRealOrder(preOrder);
        paymentService.preparePayment(preOrder);
    } catch (Exception e) {
        retryOrCompensate(preOrder, e);
    }
}

Peak Cutting and Valley Filling

Implementation Flow

Request Buffer Phase:
- Generate unique request ID
- Serialize to JSON and write to MQ
- Return within 50ms
Traffic Peak Cutting Mechanism:
- Queue as buffer for instantaneous traffic (e.g., 100k QPS)
- Set max queue backlog (e.g., 500k) as circuit breaker
User Experience Balance:
- Display “Estimated wait about 1 minute”
- Use WebSocket to push results
- Three final states: Success, Failure (sold out), Timeout |

Error Quick Reference

Symptom	Root Cause	Fix
Overselling/negative inventory	Non-atomic inventory deduction	Redis Lua atomic pre-deduction; DB optimistic lock
Order success but lost/delayed	MQ backlog or insufficient consumers	Increase partitions/consumers; isolate retry queue
Duplicate orders	At-least-once delivery without idempotency	Consumer idempotency: unique index/deduplication table
Message loss	Producer not acknowledged; broker not persisted	Kafka: acks=all
5xx errors/thread pool exhausted	Long sync chain; no fast fail	Only sync quick validation + enqueue; others async
Redis CPU spike/latency	Hot key, complex Lua, too many connections	Shard hot keys; local cache; connection pool tuning