1、查看当天有多少个IP访问:
awk '{print $1}' log_file|sort|uniq|wc -l 2、查看某一个页面被访问的次数: grep "/index.php" log_file | wc -l 3、查看每一个IP访问了多少个页面: awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file 4、将每个IP访问的页面数进行从小到大排序: awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n 5、查看某一个IP访问了哪些页面: grep ^111.111.111.111 log_file| awk '{print $1,$7}' 6、去掉搜索引擎统计当天的页面: awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l 7、查看2009年6月21日14时这一个小时内有多少IP访问: awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq |
格式字符串 | 描述 | ||||||
---|---|---|---|---|---|---|---|
%% | 百分号(Apache2.0.44或更高的版本) | ||||||
%a | 远端IP地址 | ||||||
%A | 本机IP地址 | ||||||
%B | 除HTTP头以外传送的字节数 | ||||||
%b | 以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示’- ‘而不是0。 | ||||||
%{ Foobar}C | 在请求中传送给服务端的cookieFoobar的内容。 | ||||||
%D | 服务器处理本请求所用时间,以微为单位。 | ||||||
%{ FOOBAR}e | 环境变量FOOBAR的值 | ||||||
%f | 文件名 | ||||||
%h | 远端主机 | ||||||
%H | 请求使用的协议 | ||||||
%{ Foobar}i | 发送到服务器的请求头Foobar: 的内容。 | ||||||
%l | 远端登录名(由identd而来,如果支持的话),除非IdentityCheck 设为”On “,否则将得到一个”-”。 | ||||||
%m | 请求的方法 | ||||||
%{ Foobar}n | 来自另一个模块的注解Foobar 的内容。 | ||||||
%{ Foobar}o | 应答头Foobar: 的内容。 | ||||||
%p | 服务器服务于该请求的标准端口。 | ||||||
%P | 为本请求提供服务的子进程的PID。 | ||||||
%{ format}P | 服务于该请求的PID或TID(线程ID),format 的取值范围为:pid 和tid (2.0.46及以后版本)以及hextid (需要APR1.2.0及以上版本) | ||||||
%q | 查询字符串(若存在则由一个”? “引导,否则返回空串) | ||||||
%r | 请求的第一行 | ||||||
%s | 状态。对于内部重定向的请求,这个状态指的是原始请求的状态,—%>s 则指的是最后请求的状态。 | ||||||
%t | 时间,用普通日志时间格式(标准英语格式) | ||||||
%{ format}t | 时间,用strftime(3) 指定的格式表示的时间。(默认情况下按本地化格式) | ||||||
%T | 处理完请求所花时间,以秒为单位。 | ||||||
%u | 远程用户名(根据验证信息而来;如果返回status(%s )为401,可能是假的) | ||||||
%U | 请求的URL路径,不包含查询字符串。 | ||||||
%v | 对该请求提供服务的标准ServerName 。 | ||||||
%V | 根据UseCanonicalName 指令设定的服务器名称。 | ||||||
%X | 请求完成时的连接状态:
(在1.3以后的版本中,这个指令是 | ||||||
%I | 接收的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio 模块。 | ||||||
%O | 发送的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio 模块。 |