BGrep: a regular expression search utility, like Unix grep : 文件命令 « 文件输入输出 « Java

En
Java
1. 图形用户界面
2. 三维图形动画
3. 高级图形
4. 蚂蚁编译
5. Apache类库
6. 统计图
7. 
8. 集合数据结构
9. 数据类型
10. 数据库JDBC
11. 设计模式
12. 开发相关类
13. EJB3
14. 电子邮件
15. 事件
16. 文件输入输出
17. 游戏
18. 泛型
19. GWT
20. Hibernate
21. 本地化
22. J2EE平台
23. 基于J2ME
24. JDK-6
25. JNDI的LDAP
26. JPA
27. JSP技术
28. JSTL
29. 语言基础知识
30. 网络协议
31. PDF格式RTF格式
32. 映射
33. 常规表达式
34. 脚本
35. 安全
36. Servlets
37. Spring
38. Swing组件
39. 图形用户界面
40. SWT-JFace-Eclipse
41. 线程
42. 应用程序
43. Velocity
44. Web服务SOA
45. 可扩展标记语言
Java 教程
Java » 文件输入输出 » 文件命令屏幕截图 
BGrep: a regular expression search utility, like Unix grep


/*
 * Copyright (c) 2004 David Flanagan.  All rights reserved.
 * This code is from the book Java Examples in a Nutshell, 3nd Edition.
 * It is provided AS-IS, WITHOUT ANY WARRANTY either expressed or implied.
 * You may study, use, and modify it for any non-commercial purpose,
 * including teaching and use in open-source projects.
 * You may distribute it non-commercially as long as you retain this notice.
 * For a commercial use license, or to purchase the book, 
 * please visit http://www.davidflanagan.com/javaexamples3.
 */
//package je3.nio;
import java.io.FileInputStream;
import java.io.IOException;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;
import java.nio.channels.FileChannel;
import java.nio.charset.Charset;
import java.nio.charset.UnsupportedCharsetException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;

/**
 * BGrep: a regular expression search utility, like Unix grep, but
 * block-oriented instead of line-oriented. For any match found, the filename
 * and character position within the file (note: not the line number) are
 * printed along with the text that matched.
 
 * Usage: java je3.nio.BGrep [options] <pattern> <files>...
 
 * Options: -e <encoding> specifies and encoding. UTF-8 is the default -i
 * enables case-insensitive matching. Use -s also for non-ASCII text -s enables
 * strict (but slower) processing of non-ASCII characters
 
 * This program requires that each file to be searched fits into main memory,
 * and so does not work with extremely large files.
 */
public class BGrep {
  public static void main(String[] args) {
    String encodingName = "UTF-8"// Default to UTF-8 encoding
    int flags = Pattern.MULTILINE; // Default regexp flags

    try // Fatal exceptions are handled after this try block
      // First, process any options
      int nextarg = 0;
      while (args[nextarg].charAt(0== '-') {
        String option = args[nextarg++];
        if (option.equals("-e")) {
          encodingName = args[nextarg++];
        else if (option.equals("-i")) { // case-insensitive matching
          flags |= Pattern.CASE_INSENSITIVE;
        else if (option.equals("-s")) { // Strict Unicode processing
          flags |= Pattern.UNICODE_CASE; // case-insensitive Unicode
          flags |= Pattern.CANON_EQ; // canonicalize Unicode
        else {
          System.err.println("Unknown option: " + option);
          usage();
        }
      }

      // Get the Charset for converting bytes to chars
      Charset charset = Charset.forName(encodingName);

      // Next argument must be a regexp. Compile it to a Pattern object
      Pattern pattern = Pattern.compile(args[nextarg++], flags);

      // Require that at least one file is specified
      if (nextarg == args.length)
        usage();

      // Loop through each of the specified filenames
      while (nextarg < args.length) {
        String filename = args[nextarg++];
        CharBuffer chars; // This will hold complete text of the file
        try // Handle per-file errors locally
          // Open a FileChannel to the named file
          FileInputStream stream = new FileInputStream(filename);
          FileChannel f = stream.getChannel();

          // Memory-map the file into one big ByteBuffer. This is
          // easy but may be somewhat inefficient for short files.
          ByteBuffer bytes = f.map(FileChannel.MapMode.READ_ONLY, 0, f.size());

          // We can close the file once it is is mapped into memory.
          // Closing the stream closes the channel, too.
          stream.close();

          // Decode the entire ByteBuffer into one big CharBuffer
          chars = charset.decode(bytes);
        catch (IOException e) { // File not found or other problem
          System.err.println(e)// Print error message
          continue// and move on to the next file
        }

        // This is the basic regexp loop for finding all matches in a
        // CharSequence. Note that CharBuffer implements CharSequence.
        // A Matcher holds state for a given Pattern and text.
        Matcher matcher = pattern.matcher(chars);
        while (matcher.find()) { // While there are more matches
          // Print out details of the match
          System.out.println(filename + ":" // file name
              matcher.start() ": " // character pos
              matcher.group())// matching text
        }
      }
    }
    // These are the things that can go wrong in the code above
    catch (UnsupportedCharsetException e) { // Bad encoding name
      System.err.println("Unknown encoding: " + encodingName);
    catch (PatternSyntaxException e) { // Bad pattern
      System.err.println("Syntax error in search pattern:\n" + e.getMessage());
    catch (ArrayIndexOutOfBoundsException e) { // Wrong number of arguments
      usage();
    }
  }

  /** A utility method to display invocation syntax and exit. */
  public static void usage() {
    System.err.println("Usage: java BGrep [-e <encoding>] [-i] [-s]" " <pattern> <filename>...");
    System.exit(1);
  }
}

 
Related examples in the same category
1. 触摸:设置文件上次修改的时间
2. 用NIO在Java中复制文件
3. Java中的文件复制
4. 文件字数统计,输出排序结果
5. 使用渠道和缓冲器复制文件
6. 使用Java的IO的API文件复制使用Java的IO的API文件复制
7. 模仿的Unix grep按命令
8. Grep tools
9. 文件串连
10. 使用Java API压缩文件
11. 使用Java IO API删除文件
12. Undent -删除前导空间
13. TeePrintStream tees all PrintStream operations into a file, rather like the UNIX tee(1) command
14. Java删除文件错误处理
15. DirTree -目录列表,UNIX或DOS或VMSDirTree -目录列表,UNIX或DOS或VMS
16. 清空目录
17. Report on a file's status in Java
18. 简单的目录列表
19. 只读文件
20. 根目录清单根目录清单
21. Java中的重命名文件
22. FNFilter - directory lister using FilenameFilter
23. mkdir examples
24. 删除名称相匹配的目录
25. 使用FilenameFilter列出修改的目录使用FilenameFilter列出修改的目录
26. Dir Stack Dir Stack
27. 字数统计
28. 差异:文本文件差异工具差异:文本文件差异工具
29. 计数文件中的字符
www.java2java.com | Contact Us
Copyright 2010 - 2030 Java Source and Support. All rights reserved.
All other trademarks are property of their respective owners.