メインカテゴリーを選択しなおす
過日「正規表現ってすごい」にて日本語の場合のうまくいかないということを掲載しましたが、まだ意図した動きにはなっていないのですが、日本語処理で興味深い方法が実現できました。それは、青空文庫の掲載内容を処理する方法です。Mery青空文庫文庫用対応「正規表現を使用する」オン1.改行置き換え検索文字列。置き換え後の文字列。\r\n2.《》:ルビおよび|:ルビの付く文字列の始まりを特定する記号の置き換え処理検索文字...
正規表現を色々調べていたせいか「なぜ正規表現の行頭と行末を表す記号として「^」と「$」が採用されたのか?」との記事がニュースでピックアップされました。欧米圏であったタイプライターについて、「$」はビジネスにおいては全てのタイプライターが備えるべき重要な記号ですが、プログラミングにおいては「ドル」以外の意味を持たない無意味な記号であったため割り当てたのではないかとなっていました。はっきりした話ではない...
ごきげんよう。災害級の暑さの中で約100kmのサイクリングをしても日焼けせずに済んだ、備えあれば憂いなしがモットーのgonzoです😺さて、皆さんは正規表現(Regular Expression)というのをご存じでしょうか?初耳の方や「聞いた
最近Twitterで知り合った方が、「かかずらう」に校正から「かかずらわ?う」という赤が入った事に憤ったというツイートを目にした。「かかずらう」はワ行五段動詞で、例えば以下のように活用する。 かかずらわない かかずらい、 かかずらった(促音便) かかずらう かかずらえば かかずらおう 「かかずら」が語幹で、活用語尾がワ行で展開するのでワ行五段動詞と呼ぶ。「っ」が出てくるのは音…
【Zabbix】logrtでローテーションするログファイルを監視
Zabbixでログファイル監視をするには、log[]かlogrt[]のアイテムキーを使用します。Linuxの場合だと、主にSyslog(シスログ)と言われるシステムログを監視する際に利用されます。またログの中でも、特にローテーションするログ
Zabbixには、自動でアイテムやトリガーを生成してくれるLLD(ローレベルディスカバリ)が存在しますが、プロトタイプで生成されたアイテムやトリガーは、基本的に同じ設定になります。しかし、監視対象の状態によっては、特定のトリガーだけ閾値を変
Excelで電話番号データからハイフン等の数字以外を消すユーザー定義関数サンプル
Excelで、大量の電話番号リストからハイフン等の数字以外を効率的に削除するため、正規表現を用いたユーザー定義関数のサンプルを作成した備忘メモ。 作成の背景は顧客リストの整理。
ExcelやVBAの標準機能では正規表現が使用できません。VBScript.RegExpを使えば可能とのことで、Excelのユーザー定義関数にした処理をしてみたので備忘メモ。 EXCELのワークシート関数としても使用できます。 そもそもの背景は、Power Query(パワークエリ)で正規表現を利用したかった。調べてみると、Web.Pageの機能を使ってJavaScriptの正規表現でする方法がありました。「なるほど、と思う使い方でとても参考になったのですが、私の設定方法が悪いのか、処理速度が遅かったのでVBAですることにしました。 アウトプットイメージ 今回実施したかったことは、次のような文…
Excelで特定の文字より後ろにある文字列を抽出するユーザー定義関数サンプル
Excelで少し複雑な文字列抽出をしたく、Excelのユーザー定義関数を作成してみたので備忘メモ。 簡単なものであれば、LEFT関数、MID関数、FIND関数で抽出できると思いますが、少し複雑で、大量なデータの場合は正規表現が便利です。 なお、ExcelやVBAの標準機能では正規表現が使用できませんので、次のようなユーザー定義関数を作る必要があります。 shikumika.org ただし、上記のVBScript.RegExpの正規表現では、 特定の文字より前(もしくは後ろ)にある数字の抽出 特定の文字と文字の間にある数字の抽出 といったことが簡単にはできなさそうです。 前述のユーザー定義関数サ…
正規表現で決まった文字列を検索・抽出するのはそんなに難しくないが、文字列が表示されるパターンは決まっていても、アルファベットや数字、日本語など、どのような文字列が入るかわからない場合に抽出する方法をご紹介します!今回はJavaScriptで
正規表現のAND(かつ)条件の書き方はOR(または)条件より複雑!?
正規表現については、PHPやJavaScript等でよく使うので過去の記事でも度々取り上げていますが、文章中に「〇〇と××が両方共に含まれる」と言った表現をする、AND(かつ)条件を意識したことがありませんでした。そこで今回は、OR条件とA