热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【Java实例】统计String单词数的三种方法

统计字符串里包含有多少个单词,这是Java代码常用的场景。本文介绍三种简单的方法来对其进行统计。这里所谓的单词,是指连续的非空字符串。如“Hello”则

统计字符串里包含有多少个单词,这是Java代码常用的场景。本文介绍三种简单的方法来对其进行统计。这里所谓的单词,是指连续的非空字符串。如“Hello”则为一个词,“I love Guangzhou”则为三个词。

 

方法一:使用split

在类String中,有split()这个方法,可以将字符进行分割。可以通过对字符串以空白字符进行分割,则可以得到结果。

public int countWithSplit(String str) {if (Strings.isNullOrEmpty(str)) {return 0;}return str.split("\\s+").length;
}

代码中"\\s+"为正则表达式,表示所有的空白字符。

 

方法二:使用StringTokenizer

public int countWithStringTokenizer(String str) {if (Strings.isNullOrEmpty(str)) {return 0;}StringTokenizer tokenizer = new StringTokenizer(str);return tokenizer.countTokens();
}

StringTokenizer是一个很有用的类,构造函数有三个:

1. StringTokenizer(String str) :构造一个用来解析 str 的 StringTokenizer 对象。java 默认的分隔符是空格("")、制表符(\t)、换行符(\n)、回车符(\r)。

2. StringTokenizer(String str, String delim) :构造一个用来解析 str 的 StringTokenizer 对象,并提供一个指定的分隔符。

3. StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析 str 的 StringTokenizer 对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。

 

方法三:使用原始的char判断

public int countWithChar(String str) {if (Strings.isNullOrEmpty(str)) {return 0;}int wordCount &#61; 0;boolean isWord &#61; false;int endOfLine &#61; str.length() - 1;char[] chars &#61; str.toCharArray();for (int i &#61; 0; i < chars.length; i&#43;&#43;) {// 如果是非空字符, word &#61; true.if (isWord(chars[i]) && i !&#61; endOfLine) {isWord &#61; true;// 非空字符后遇到空字符&#xff0c;则数量加1} else if (!isWord(chars[i]) && isWord) {wordCount&#43;&#43;;isWord &#61; false;// 非空字符后遇到行尾} else if (isWord(chars[i]) && i &#61;&#61; endOfLine) {wordCount&#43;&#43;;}}return wordCount;
}private boolean isWord(char c) {return c !&#61; &#39; &#39;&& c !&#61; &#39;\t&#39;&& c !&#61; &#39;\n&#39;&& c !&#61; &#39;\r&#39;&& c !&#61; &#39;\f&#39;;
}

 

 

测试代码

简单写了几个测试用例&#xff0c;测试通过。

public class CountWordTest {private CountWord countWord &#61; new CountWord();&#64;Testpublic void test() {testStringCount(null, 0);testStringCount("", 0);testStringCount(" ", 0);testStringCount(" \t\r\n\f", 0);testStringCount("0", 1);testStringCount("abcdef", 1);testStringCount("a b c", 3);testStringCount("a,b,c", 1);testStringCount("a\rb\nc", 3);testStringCount("a,b\t\nc", 2);}private void testStringCount(String str, int expectedCount) {assertEquals(expectedCount, countWord.countWithSplit(str));assertEquals(expectedCount, countWord.countWithStringTokenizer(str));assertEquals(expectedCount, countWord.countWithChar(str));}
}

 

总结

这三种方法都非常简单&#xff0c;没有什么技术难点&#xff0c;用到了String、StringTokenizer、正则、Guava、JUnit等&#xff0c;非常基础。

 

---------THE END----------

觉得不错就扫码关注公众号呗&#xff0c;更多精彩还在后面哦~

学好技术&#xff0c;过好生活。


推荐阅读
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • 本文介绍了如何在给定的有序字符序列中插入新字符,并保持序列的有序性。通过示例代码演示了插入过程,以及插入后的字符序列。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 猜字母游戏
    猜字母游戏猜字母游戏——设计数据结构猜字母游戏——设计程序结构猜字母游戏——实现字母生成方法猜字母游戏——实现字母检测方法猜字母游戏——实现主方法1猜字母游戏——设计数据结构1.1 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • 本文介绍了如何使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换。首先解释了JSON的概念和数据格式,然后详细介绍了相关API,包括JSONObject和Gson的使用方法。接着讲解了如何将json格式的字符串转换为kotlin对象或List,以及如何将kotlin对象转换为json字符串。最后提到了使用Map封装json对象的特殊情况。文章还对JSON和XML进行了比较,指出了JSON的优势和缺点。 ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • 本文详细介绍了Python中正则表达式和re模块的使用方法。首先解释了转义符的作用,以及如何在字符串中包含特殊字符。然后介绍了re模块的功能和常用方法。通过学习本文,读者可以掌握正则表达式的基本概念和使用技巧,进一步提高Python编程能力。 ... [详细]
  • 本文详细介绍了GetModuleFileName函数的用法,该函数可以用于获取当前模块所在的路径,方便进行文件操作和读取配置信息。文章通过示例代码和详细的解释,帮助读者理解和使用该函数。同时,还提供了相关的API函数声明和说明。 ... [详细]
  • 电话号码的字母组合解题思路和代码示例
    本文介绍了力扣题目《电话号码的字母组合》的解题思路和代码示例。通过使用哈希表和递归求解的方法,可以将给定的电话号码转换为对应的字母组合。详细的解题思路和代码示例可以帮助读者更好地理解和实现该题目。 ... [详细]
author-avatar
sundy柳
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有