博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
单词统计续
阅读量:4840 次
发布时间:2019-06-11

本文共 7375 字,大约阅读时间需要 24 分钟。

package test;import java.io.BufferedReader;import java.io.FileNotFoundException;import java.io.FileReader;import java.io.IOException;import java.text.NumberFormat;import java.util.ArrayList;import java.util.HashMap;import java.util.Scanner;   public class W1 {    static Scanner in = new Scanner(System.in);     public static void main(String[] args) throws IOException {                 deal();        }                                 public static void deal() throws IOException{    int choice = 0;         while(choice != 5)    {        System.out.println("请输入选择");        System.out.println("0输出字母");        System.out.println("1输出单词");        System.out.println("2输出前n个单词");        System.out.println("3过滤无用词");        System.out.println("4统计短语");                          choice = in.nextInt();        switch (choice)        {        case 0 :        {            word();            break;        }        case 1:        {            String filePath = "d:\\文件\\单词.txt";            String sz=W3.readTxtFile(filePath);            System.out.println(W2.StatList1(sz));             break;        }        case 2:        {            String filePath = "d:\\文件\\单词.txt";            String sz=W3.readTxtFile(filePath);            System.out.println(W2.StatList2(sz));             break;        }        case 3:        {            String filePath = "d:\\文件\\单词.txt";            String sz=W3.readTxtFile(filePath);            System.out.println(W2.StatList(sz));             break;        }                 case 4:        {            String filePath = "d:\\文件\\stopword.txt";            String sz=W3.readTxtFile(filePath);            String[] slist = sz.split("[^a-zA-Z\']+");                         break;        }        }        }}                      public static void word() throws IOException{    try {        //IO操作读取文件内容        FileReader fr = new FileReader("d:\\文件\\单词.txt");        BufferedReader br = new BufferedReader(fr);        NumberFormat nf = NumberFormat.getInstance();                  // 设置精确到小数点后2位          nf.setMaximumFractionDigits(2);        HashMap
map = new HashMap
(); String string =null; Integer count = 0;//每个字母的次数 Integer total = 0;//总共多少个字母 while ((string=br.readLine())!=null) { char[] ch = string.toCharArray(); for (int i = 0; i < ch.length; i++) { if (ch[i] > 'A' && ch[i]< 'z') { total++; ch[i] = Character.toLowerCase(ch[i]); count = map.get(ch[i]+""); if (count == null) { count = 1; }else { count++; } map.put(ch[i]+"", count); } } } ArrayList
list = new ArrayList
(); list.addAll(map.keySet()); //将单词添加到list中 //排序按照出现次数降序排列 for(int i = 0;i < list.size();i++) { for(int j = 0;j < (list.size() - i-1);j++) //list.size() - i-1因为要用到i+1要考虑是否超出范围的问题 { if(map.get(list.get(j)) < map.get(list.get(j+1))) { String t = list.get(j); list.set(j, list.get(j+1)); list.set( j+1, t); } } } for(int i = 0 ; i < list.size();i++) { System.out.println(list.get(i) + ":" + map.get(list.get(i)) +" "+ nf.format((float)(map.get(list.get(i)))*100/total) + "%"); } } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); }} }package test;import java.io.File;import java.io.IOException;import java.util.ArrayList;import java.util.HashMap;import java.util.Iterator;import java.util.Scanner; public class W2 { public static String StatList2(String str) { StringBuffer sb = new StringBuffer(); HashMap
has = new HashMap
(); // 打开一个哈希表 String[] slist = str.split("[^a-zA-Z\']+"); for (int i = 0; i < slist.length; i++) { if (!has.containsKey(slist[i])) { has.put(slist[i], 1); } else { has.put(slist[i],has.get(slist[i])+1 ); } } Iterator
iterator = has.keySet().iterator(); String a[]=new String[100]; int s[]=new int[100]; int n; Scanner in=new Scanner(System.in); System.out.println("输入前n个最常出现的单词:"); n=in.nextInt(); for(int i=0;i
has = new HashMap
(); // 打开一个哈希表 String[] slist = str.split("[^a-zA-Z\']+"); for (int i = 0; i < slist.length; i++) { if (!has.containsKey(slist[i])) { has.put(slist[i], 1); } else { has.put(slist[i],has.get(slist[i])+1 ); } } Iterator
iterator = has.keySet().iterator(); String a[]=new String[100]; int s[]=new int[100]; for(int i=0;i<50;i++) { iterator = has.keySet().iterator(); while(iterator.hasNext()) { String word = (String) iterator.next(); if(s[i]
has = new HashMap
(); // 打开一个哈希表 String[] slist = str.split("[^a-zA-Z\']+"); for (int i = 0; i < slist.length; i++) { if (!has.containsKey(slist[i])) { has.put(slist[i], 1); } else { has.put(slist[i],has.get(slist[i])+1 ); } } Iterator
iterator = has.keySet().iterator(); String a[]=new String[100]; int s[]=new int[100]; int n=15; int judge; Scanner in=new Scanner(System.in); System.out.println("输入前n个最常出现的单词:"); n=in.nextInt(); for(int i=0;i
fil=getFiles("d:\\文件");//目录下的文件 ArrayList
fil=getDirectory(file);//目录下的文件和子目录里的文件 for(int i=0;i
getFiles(String path) { ArrayList
files = new ArrayList
(); File file = new File(path); File[] tempList = file.listFiles(); for (int i = 0; i < tempList.length; i++) { if (tempList[i].isFile()) { files.add(tempList[i].toString()); } if (tempList[i].isDirectory()) { } } return files; } private static ArrayList
getDirectory(File file) { ArrayList
files = new ArrayList
(); ArrayList
files1 = new ArrayList
(); //获取该目录下的文件列表 File flist[] = file.listFiles(); for (File f : flist) { if (f.isDirectory()) { // 如果f是一个目录 files1=getFiles(f.getAbsolutePath()); files.addAll(files1); getDirectory(f); } else { //如果f是一个文件 files.add(f.getAbsolutePath()); } } return files; } }package test; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStreamReader;import java.io.OutputStreamWriter; //import java.io.Reader; //从文本文档中读入public class W3 { public static String readTxtFile(String filePath){ try { String encoding="GBK"; File file=new File(filePath); if(file.isFile() && file.exists()){ //判断文件是否存在 InputStreamReader read = new InputStreamReader( new FileInputStream(file),encoding);//考虑到编码格式 BufferedReader bufferedReader = new BufferedReader(read); String lineTxt = null; String lineText=""; while((lineTxt = bufferedReader.readLine()) != null) { lineText+=(lineTxt); } read.close(); return lineText; } else { System.out.println("找不到指定的文件"); } } catch (Exception e) { System.out.println("读取文件内容出错"); e.printStackTrace(); } return null; } public static void daochu(String a) throws IOException { File file=new File("d:\\文件\\c.txt"); FileOutputStream fos=new FileOutputStream(file); OutputStreamWriter osw = new OutputStreamWriter(fos,"UTF-8"); osw.append(a); osw.close(); fos.close(); }}

  

转载于:https://www.cnblogs.com/NCLONG/p/11062486.html

你可能感兴趣的文章
unresolved external symbol "public: virtual __thiscall...错误
查看>>
php连接oracle oracle开启扩展
查看>>
入门自定义标签,(在SSH里面有自定义标签的练习)
查看>>
最近遇到的一些问题汇总
查看>>
mysql插入数据报错一二
查看>>
spring mvc 常用前后台数据交互的注解
查看>>
Linux学习12-CentOS设置多个tomcat开机自启动
查看>>
ASP.NET MVC Controller 编程所涉及到的常用属性成员
查看>>
条款37:绝不重新定义继承而来的缺省参数值(Never redefine a function's inherited default parameter value)...
查看>>
HDU 4288 Coder 【线段树+离线处理+离散化】
查看>>
[K/3Cloud] 如何从被调用的动态表单界面返回数据
查看>>
c# winform读取xml创建菜单
查看>>
设计模式-工厂方法 简单工厂 抽象工厂 模板方法
查看>>
HDU - 6162(Ch’s gift)
查看>>
showModalDialog()方法
查看>>
终端命令对字符串进行sha1、md5、base64、urlencode/urldecode
查看>>
Rxjava+Retrofit2+Okhttp3多文件上传(服务器端代码+客户端代码)
查看>>
Spring系列之bean的使用
查看>>
Mac下lombok无法安装到eclipse mars
查看>>
Mac下为什么有的文件名后带一个* 星号?
查看>>