热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

安卓知识小点

Android中对html进行分析1.Android中获取html源代码publicStringgetHtmlString(StringurlString){try{URLurln

Android中对html进行分析


1.Android 中获取html源代码

public String getHtmlString(String urlString) {  
   try {  
       URL url = new URL(urlString);  
       URLConnection ucon = url.openConnection();  
       InputStream instr = ucon.getInputStream();  
       BufferedInputStream bis = new BufferedInputStream(instr);  
       ByteArrayBuffer baf = new ByteArrayBuffer(500);  
       int current = 0;  
       while ((current = bis.read()) != -1) {  
           baf.append((byte) current);  
       }  
       return EncodingUtils.getString(baf.toByteArray(), "UTF-8");  
   } catch (Exception e) {  
       return e.getMessage();
   }  
}
    或者亦可以用jsoup直接获取html


 


2.只要将jsoup的jar文件加入libs文件夹中即可在工程中使用jsoup,jsoup 中文版的使用手册

http://www.open-open.com/jsoup/

 

Android读取word文件


  1. package  com.word.read;

  2. import  java.io.File;
  3. import  java.io.FileInputStream;
  4. import  java.io.FileNotFoundException;

  5. import  org.textmining.text.extraction.WordExtractor;

  6. import  Android.app.Activity;
  7. import  Android.os.Bundle;
  8. import  Android.os.Environment;
  9. import  Android.widget.TextView;

  10. public  class  WordReader  extends  Activity {
  11.      /** Called when the activity is first created. */
  12.      
  13.      private  TextView text;
  14.      
  15.      @Override
  16.      public  void  onCreate(Bundle savedInstanceState) {
  17.          super .onCreate(savedInstanceState);
  18.          setContentView(R.layout.main);
  19.          
  20.          text = (TextView) findViewById(R.id.text);
  21.          
  22.          String str = readWord(Environment.getExternalStorageDirectory().getAbsolutePath() + "/baojinggong.doc" );
  23.          text.setText(str.trim().replace( "\r" ,  "" ));
  24.      }
  25.      
  26.      public  String readWord(String file){
  27.          //创建输入流用来读取doc文件
  28.          FileInputStream in;
  29.          String text =  null ;
  30.          try  {
  31.              in =  new  FileInputStream( new  File(file));
  32.              WordExtractor extractor =  null ;
  33.              //创建WordExtractor
  34.              extractor =  new  WordExtractor();
  35.              //进行提取对doc文件
  36.              text = extractor.extractText(in);
  37.          }
  38.          catch  (FileNotFoundException e) {
  39.              e.printStackTrace();
  40.          }
  41.          catch  (Exception e) {
  42.              e.printStackTrace();
  43.          }
  44.          return  text;
  45.      }
  46. }

 


推荐阅读
author-avatar
路人
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有