35. Java线上接口响应慢如何排查？

秀才2025年2月14日大约 14 分钟java慢接口响应慢性能调优

线上接口响应慢可以说是比进程突然挂掉更常见的问题了，在影响上它可能不会像进程中断那样严重，导致整个服务不可用。虽然影响面小，但是由于大量的请求延迟，会给用户的体验带来严重的影响。所以，针对线上接口响应慢问题的排查与处理也是我们需要重点掌握的。这篇文章将会系统介绍一些常见的导致线上接口响应慢的原因及排查手段

1. 接口性能问题排查路径

接口的性能受很多因素的影响，抛开系统问题不谈，比如单纯的流量激增，请求过多都会导致性能下降，接口响应变慢。另外数据库层面的慢查询，业务层面的代码逻辑错误以及服务器资源问题都会导致接口响应慢。对于慢接口常见的排查点如下图：

2. 业务代码排查

业务代码的实现在很大程度上也决定着程序的性能问题，一份优雅的业务代码，其性能自然会高不少。对于比较复杂的业务逻辑，由于流程非常多，在业务代码中往往会出现循环调用和顺序调用的情况，这两种实现再很大程度上会影响程序的性能，并且这两种实现方式是可以优化的

2.1 循环调用

循环调用不是说代码中所有循环里的逻辑都有问题，而是说对于循环里每次调用的逻辑几乎一样，前后又毫无关联的逻辑往往是可以优化的，比如下列代码逻辑，需要循环调用processData函数处生成30个Data类型的数据然后添加到list数组中

List<Data> list = new ArrayList<>();
for(int i = 0 ; i < 30 ; i ++) {
    Data date = processData(i); // 计算30个Data类型的数据，添加到list数组中
    list.add(date);
}

很明显，这里每个数据的生成都是相互独立的，完全可以采用多线程方式进行优化

// 建立一个线程池，并行处理上述process逻辑
public static ExecutorService commonThreadPool = new ThreadPoolExecutor(6, 6, 300L,
    TimeUnit.SECONDS, new LinkedBlockingQueue<>(10), commonThreadFactory, new ThreadPoolExecutor.DiscardPolicy());

// 开始多线程调用
List<Future<Data>> futures = new ArrayList<>();
for(int i = 0 ; i < 30 ; i ++) {
    Future<Data> future = commonThreadPool.submit(() -> processData(i));
    futures.add(future);
}

// 从futures获取结果添加到list中
List<Data> list = new ArrayList<>();
try {
    for (int i = 0 ; i < futures.size() ; i ++) {
        list.add(futures.get(i).get());
    }
} catch (Exception e) {
    log.error("error：", e);
}

2.2 顺序调用

除了循环调用之外，有的业务逻辑本身很复杂，需要涉及多个调用过程，如果每个接口都串行的顺序调用的话，性能必然不好，其实这种情况下钱也可以用多线程的方式进行，例如：

代码逻辑可以简单表示如下：

A a = funcA();
B b = funcB();

C c = funcC(a, b);

D d = funcD(c);
E e = funcE(c);

return funcResult(d, e);

这里的逻辑其实可以用CompletableFuture来进行优化：

CompletableFuture<A> futureA = CompletableFuture.supplyAsync(() -> funcA());
CompletableFuture<B> futureB = CompletableFuture.supplyAsync(() -> funcB());
CompletableFuture.allOf(futureA,futureB) // 等funcA()和funcB()两个并行任务都执行完成，

C c = funcC(futureA.join(), futureB.join());

CompletableFuture<D> futureD = CompletableFuture.supplyAsync(() -> funcD(c));
CompletableFuture<E> futureE = CompletableFuture.supplyAsync(() -> funcE(c));
CompletableFuture.allOf(futureD,futureE) // 等funcD()和funE()两个并行任务都执行完成，

return doResult(futureD.join(),futureE.join());

在原来的逻辑中，funcA()和funcB()是串行执行的，funcD()和funE()也是串行执行的，优化之后，funcA()和funcB()变成并行执行的，funcD()和funE()也是并行的。最大执行时间就只取决于并行的哪个逻辑更慢了，而不会是运行时间的叠加了

2.3 线程池设计不合理

线程池一般被我们用作逻辑并行优化的主要手段，但是线程池的设计不合理同样会使程序的执行效率很慢。线程池有三个重要参数：核心线程数、最大线程数、等待队列。回顾一下线程池的处理逻辑：

线程池初始创建后，里面的线程数为0，当有任务提交的时候，开始创建和核心线程

如果核心线程满了，只有任务提交的话，则任务会进入到等待队列

如果等待队列也满了，线程池开始创建非核心线程

如果线程池里的线程总数达到了最大线程数，还有任务继续提交的话，任务会阻塞

线程池导致性能问题主要有以下几种情况：

核心线程设置过小，没有达到并行的效果
一个线程池有多个业务公用，非核心业务占据了大量的线程，导致主线任务工作线程不足
任务过多，线程池里的线程被占满，大量任务阻塞

2.4 锁设计不合理

程序中的锁设计不合理同样会导致性能低下，设计不合理的锁一般是以下两种情况：

2.4.1 锁类型不合理

在一般的编程语言中，提供的锁一般都有互斥锁和读写锁两种，读写锁就是读可以共享，而写互斥，互斥锁就是在任何场景下都是互斥的，所以加互斥锁的性能会更差。所以在可以加读写锁的时候，如果我们加成了互斥锁，那么在读远远多于写的场景下，效率会极大降低程序运行效率。

2.4.2 锁粒度太粗

锁粒度过粗是另一种常见的锁设计不合理导致程序性能差的情况，通常把锁包裹的范围过大，使得加锁时间会过长，比如一下代码：

public synchronized void doJob() {
    File f = processlData();
    copyFile(f);
    sendMessage();
}

这段代码逻辑有三个主要的阶段任务，计算数据，拷贝文件，最后发送消息。直观上来说，处理数据这里可能涉及到并发问题，而拷贝文件以及发送消息都是后续工作了，完全可以不加锁。这里的枷锁范围就可以优化，完全可以改成：

public void doSome() {
    File f = null;
    synchronized(this) {
        f = processlData();
    }
    copyFile(f);
    sendMessage();
}

3. 数据库排查

除了业务代码外，另一个非常常见的影响后端接口性能的问题就是数据库问题了。涉及到数据库导致的性能问题，有很多个方面，下面大致做了个不完全总结

3.1 深分页问题

mysql的分页查询一般使用limit查询语句来完成，比如查询一张student表里查100到120这20条数据

select * from student limit 100,20

mysql会把前120条数据都查出来，抛弃前100条，返回20条，这里查询120条数据，mysql性能不会有什么问题，但是当分页深度变得越来越大，比如达到100w的时候。

select * from student limit 1000000,20

这样mysql会查出来1000020条数据，抛弃1000000条，速度必然很慢。这里可以做一个优化，直接查询id>1000000的数据，然后取20条即可

select * from student where id > 1000000 limit 20

这样，mysql会走主键索引，直接找到1000000处，然后查出来20条数据，效率会高得多

3.2 未加索引

这个可以借助mysql提供的explain工具来排查，看下接口设计的到sql语句查询有没有走索引，关于explain的分析，这里就不再赘述。

3.3 索引失效

比起未加索引，索引失效的的情况更加复杂，排查起来也更困难一些。同样可以通过explain来查看索引是否生效，然后采取对应措施，下面总结了一些常见的索引失效的场景

关于具体的索引失效的sql这里就不再赘述，这里主要讲一下索引失效的第一个点，就是字段区分性差，什么是字段区分性差呢？可以按照以下3种情况来理解

字段值少，比如一个性别字段，总共只有两个值，那这个字段的索引区分度就很低
某个字段大量为空，只有少量有值，这个字段的区分度也很低
字段值太集中，比如一个字段值90%都是1，剩下10%可能是其他值，区分度也很低

所以在建立索引的时候，最好不要建立在区分度低的字段上，这样会导致索引失效

join查询其实可以用来优化子查询，一般来说，在sql中大量使用子查询是不推荐的，因为执行子查询时，MySQL 需要为内层查询语句的查询结果建立一个临时表，然后外层查询语句从临时表中查询记录。查询完毕后，再撤销这些临时表。这样会消耗过多的CPU 和IO资源。所以子查询一般都建议优化成join来查询
即便优化成join查询了，join关联的表也不宜过多，如果表的数据量很大，一般来说2-3张表就可以了。join操作其实也是在内存去做的，所以关联的数据量不宜过大，同时join_buffer也要适当设置的大一些，这样效率就高一些。相反，如果join的数据量太大，mysql会采用在硬盘上创建临时表的方式进行多张表的关联匹配，显然这就涉及到磁盘IO了，效率就会低的多
如果在业务中的查询一定要涉及到多个表，而且数据量很大，那么最好的方式就是在业务层把查询拆成个子查询，然后在业务层取做聚合拼装，这样效率反而更高

多 Agent 编排 + RAG 混合检索 · 31 篇深度教程 + 50+ 面试题

点击查看 DevSupport AI 实战项目 →

35. Java线上接口响应慢如何排查？

1. 接口性能问题排查路径

2. 业务代码排查

2.1 循环调用

2.2 顺序调用

2.3 线程池设计不合理

2.4 锁设计不合理

2.4.1 锁类型不合理

2.4.2 锁粒度太粗

3. 数据库排查

3.1 深分页问题

3.2 未加索引

3.3 索引失效

3.4 join查询过多

3.5 表数据量过大

4. 系统资源问题

5. 通用解决方案

5.1 加缓存

5.2 异步化

6. 小结

7. 资料分享

学习交流