首页 > 其他分享 >力扣---2047. 句子中的有效单词数

力扣---2047. 句子中的有效单词数

时间:2023-02-01 23:45:16浏览次数:36  
标签:2047 状态机 sentence 字母 --- 力扣 token 单词 句子

句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。

如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:

    仅由小写字母、连字符和/或标点(不含数字)组成。
    至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。
    至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。

这里给出几个有效单词的例子:"a-b."、"afad"、"ba-c"、"a!" 和 "!" 。

给你一个字符串 sentence ,请你找出并返回 sentence 中 有效单词的数目 。

 

示例 1:

输入:sentence = "cat and  dog"
输出:3
解释:句子中的有效单词是 "cat"、"and" 和 "dog"

示例 2:

输入:sentence = "!this  1-s b8d!"
输出:0
解释:句子中没有有效单词
"!this" 不是有效单词,因为它以一个标点开头
"1-s" 和 "b8d" 也不是有效单词,因为它们都包含数字

示例 3:

输入:sentence = "alice and  bob are playing stone-game10"
输出:5
解释:句子中的有效单词是 "alice"、"and"、"bob"、"are" 和 "playing"
"stone-game10" 不是有效单词,因为它含有数字

 

提示:

    1 <= sentence.length <= 1000
    sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成
    句子中至少有 1 个 token

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/number-of-valid-words-in-a-sentence
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

 

这道题出的很拉胯,没啥意思。

可以遍历加各种if判断,也可以用正则表达式判断。

我用了参考大佬们写的状态机,每天学点新知识,我是xx。

代码如下:

class Solution {
    public static int countValidWords(String sentence) {
//        参考大佬的状态机写的,总共有以下几种情况:
//        状态机 -1:错误, 0:空格, 1:字母, 2:字母+链接符, 3:字母+链接符+字母, 4:结尾
//        遇到某个字符后,判断它加上前面的属于哪种状态,然后转移到这种状态加上该字符后处于的状态。
//        以 “playing stone-game10” 为例:
//        刚开始state = 0,代表此时的状态为空格。遇到 'p' 后,变成了字母,即序号为1的情况。
//        之后的laying都是这种情况。再之后的空格,由于状态机不为0,则表示一个单词完毕,开始下一个单词。
//        stone和playing一样,状态机都是1。之后的 '-',则该单词变成了 2:字母+链接符 的情况。再之后又是字母,状态机
//        变成了 3:字母+链接符+字母 的情况。遇到数字后,不再符合要求,状态机变成-1。再然后运行到额外添加的空格,进行结算。
//        由于状态机是 -1 不符合要求。
//        其他情况和这个的判断类似。
        int state = 0, res = 0;
        sentence += ' ';
        for (char a : sentence.toCharArray()) {
            if (a == ' ') {
                if (state == 1 || state == 3 || state == 4) {
                    res++;
                }
                state = 0;
            } else if ('a' <= a && a <= 'z') {
                if (state == 0 || state == 2) {
                    state++;
                }
                else if (state == 1 || state == 3) {
                    continue;
                }
                else {
                    state = -1;
                }
            } else if (a == '-') {
                if (state == 1) {
                    state = 2;
                }
                else {
                    state = -1;
                }
            } else if (a == '.' || a == ',' || a == '!') {
                if (state == 0 || state == 1 || state == 3) {
                    state = 4;
                }
                else {
                    state = -1;
                }
            } else {
                state = -1;
            }
        }
        return res;
    }
}

 

标签:2047,状态机,sentence,字母,---,力扣,token,单词,句子
From: https://www.cnblogs.com/allWu/p/17084514.html

相关文章