线上服务器负载过高发生了报警,同事找我求救。
我看到机器的负载都超过20了,查看java进程线程栈,找到了出问题的代码。
下面是其代码片段,实际情况错误处理比这更坏。
1 package demo;
2
3 import java.io.bufferedreader;
4 import java.io.inputstream;
5 import java.io.inputstreamreader;
6 import java.net.httpurlconnection;
7 import java.net.url;
8 import java.net.urlconnection;
9 import org.apache.commons.lang.stringutils;
10
11 /**
12 * @author adyliu (imxylz#gmail.com)
13 * @since 2012-3-15
14 */
15 public class faultdemo {
16
17 /**
18 * @param args
19 */
20 public static void main(string[] args) throws exception {
21 final string tudou = "http://v.youku.com/v_playlist/f17170661o1p9.html";
22
23 url url = new ;
24 httpurlconnection conn = (httpurlconnection) url.openconnection();
25 conn.connect();
26 try {
27 inputstream in = conn.getinputstream();
28 bufferedreader br = new bufferedreader(new inputstreamreader(in, "utf-8"));
29 stringbuilder buf = new stringbuilder();
30 string line = null;
31 while ((line = br.readline()) != null) {
32 if (stringutils.isnotempty(buf.tostring())) {
33 buf.append("\r\n");
34 }
35 buf.append(line);
36 }
37 //do something with 'buf'
38
39 } finally {
40 conn.disconnect();
41 }
42
43 }
44
45 }
46
思考下,这段代码有什么
致命问题么?(这里不追究业务逻辑处理的正确性以及细小的瑕疵)
.
..
...
现在回来。
我发现线程栈里面的线程都runnable在32行。
这一行看起来有什么问题呢?stringbuilder.tostring()不是转换成string么?apache commons-lang里面的stringutils.isnotempty使用也没问题啊?
看代码,人家的逻辑其实是判断是否是第一行,如果不是第一行那么就增加一个换行符。
既然cpu在这里运行,那么就说明这个地方一定存在非常耗费cpu的操作,导致cpu非常繁忙,从而系统负载过高。
看详细堆栈,其实cpu在进行内存的拷贝动作。
看下面的源码。
java.lang.stringbuilder.tostring()
public string tostring() {
// create a copy, don't share the array
return new string(value, 0, count);
}
接着看java.lang.string的构造函数:
public string(char value[], int offset, int count) {
if (offset < 0) {
throw new stringindexoutofboundsexception(offset);
}
if (count < 0) {
throw new stringindexoutofboundsexception(count);
}
// note: offset or count might be near -1>>>1.
if (offset > value.length - count) {
throw new stringindexoutofboundsexception(offset count);
}
this.offset = 0;
this.count = count;
this.value = arrays.copyofrange(value, offset, offset count);
}
看出来了么?
问题的关键在于string构造函数的最后一行,value并不是直接指向的,而是重新生成了一个新的字符串,使用系统拷贝函数进行内存复制。
java.util.arrays.copyofrange(char[], int, int)
public static char[] copyofrange(char[] original, int from, int to) {
int newlength = to - from;
if (newlength < 0)
throw new illegalargumentexception(from " > " to);
char[] copy = new char[newlength];
system.arraycopy(original, from, copy, 0,
math.min(original.length - from, newlength));
return copy;
}
好了,再回头看逻辑代码32行。
if (stringutils.isnotempty(buf.tostring())) {
buf.append("\r\n");
}
这里有问题的地方在于每次循环一行的时候都生成一个新的字符串。也就是说如果http返回的结果输入流中有1000行的话,将额外生成1000个字符串(不算stringbuilder扩容生成的个数)。每一个字符串还比前一个字符串大。
我们来做一个简单的测试,我们在原来的代码上增加几行计数代码。
int lines =0;
int count = 0;
int malloc = 0;
while ((line = br.readline()) != null) {
lines ;
count =line.length();
malloc = count;
if (stringutils.isnotempty(buf.tostring())) {
buf.append("\r\n");
}
buf.append(line);
}
system.out.println(lines " -> " count " -> " malloc);
我们记录下行数lines以及额外发生的字符串拷贝大小malloc。
这是一次输出的结果。
1169 -> 66958 -> 39356387
也就是1169行的网页,一共是66958字节(65kb),结果额外生成的内存大小(不算stringbuilder扩容占用的内存大小)为39356387字节(37.5mb)!!!
试想一下,cpu一直频繁于进行内存分配,机器的负载能不高么?我们线上服务器是2个cpu 16核,内存24g的redhat enterprise linux 5.5,负载居然达到几十。这还是只有访问量很低的时候。这就难怪服务频繁宕机了。
事实上我们有非常完善和丰富的基于apache commons-httpclient的封装,操作起来也非常简单。对于这种简单的请求,只需要一条命令就解决了。
string platform.utils.httpclientutils.getresponse(string)
string platform.utils.httpclientutils.postresponse(string, map)
即使非要自造轮子,处理这种简单的输入流可以使用下面的代码,就可以很好的解决问题。
inputstream in =
bytearrayoutputstream baos =
new bytearrayoutputstream(8192);
int len = -1;
byte[] b =
new byte[8192];
//8k
while ((len = in.read(b)) > 0) {
baos.write(b, 0, len);
}
baos.close();
//ignore is ok
string response =
new string(baos.tobytearray(), encoding);
当然了,最后紧急处理线上问题最快的方式就是将有问题的代码稍微变通下即可。
if (buf.length() > 0) {
buf.append("\r\n");
}
这个问题非常简单,只是想表达几个观点:
- 团队更需要合作,按照规范来进行。自造轮子不是不可以,但是生产环境还是要限于自己熟悉的方式。
- 即使非常简单的代码,也有可能有致命的陷阱在里面。善于思考才是王道。
- 学习开源的代码和常规思路,学习解决问题的常规做法。这个问题其实非常简单,熟悉输入输出流的人非常熟练就能解决问题。
©2009-2014 imxylz
|求贤若渴