努力したWiki

推敲の足りないメモ書き多数

ユーザ用ツール

サイト用ツール


documents:windows:code:code-009

PowerShellテキスト分割ツール

2024-08-31.3
オプション -ReadLine を -SplitLine に変更した

2024-08-31.2
アドバイスをもらってGet-Contentに-ErrorAction Stopを追加

2024-08-31
ちょっと作り直した

これは何?

指定のテキストファイルを指定の行数毎に分割するやっつけスクリプト。動作は少々重め。

使い方

PowerShellが実行可能な環境であるのは前提条件。
エラー処理を省いている。引数の範囲や指定漏れ等を確認していない。利用に際しては注意。

.\splitlog.ps1 -Path ログテキストファイル名
               -SkipLine 先頭からスキップする行数
               -LimitLine 読み込む最大行数
               -SplitLine 分割単位行数
               -Encode 文字コードエンコーディング

指定行数で分割する

以下はあるアプリケーションのログpdi.2024-01-20.logを1000行単位で分割する例。
この例だと、pdi.2024-01-20.log-001~008 の8ファイルに分割された。
表示されるタイプスタンプは処理開始日時。

d:\sandbox>powershell -File .\splitlog.ps1 -Path pdi.2024-01-20.log -SplitLine 1000
2024/08/31 18:54:35 Pos:0000000000, Start, Skip 0 Lines, Split 1000 Lines, All rows read.
2024/08/31 18:54:35 Pos:0000000001, Creating pdi.2024-01-20.log-001
2024/08/31 18:54:35 Pos:0000001001, Creating pdi.2024-01-20.log-002
2024/08/31 18:54:36 Pos:0000002001, Creating pdi.2024-01-20.log-003
2024/08/31 18:54:36 Pos:0000003001, Creating pdi.2024-01-20.log-004
2024/08/31 18:54:37 Pos:0000004001, Creating pdi.2024-01-20.log-005
2024/08/31 18:54:37 Pos:0000005001, Creating pdi.2024-01-20.log-006
2024/08/31 18:54:38 Pos:0000006001, Creating pdi.2024-01-20.log-007
2024/08/31 18:54:39 Pos:0000007001, Creating pdi.2024-01-20.log-008
2024/08/31 18:54:39 Pos:0000007320, Finished.

d:\sandbox>

指定行数を読み飛ばす

以下は先頭6500行をスキップして300行毎に分割している例。

d:\sandbox>powershell -File .\splitlog.ps1 -Path pdi.2024-01-20.log -SkipLine 6500 -SplitLine 300
2024/08/31 18:55:14 Pos:0000000000, Start, Skip 6500 Lines, Split 300 Lines, All rows read.
2024/08/31 18:55:14 Pos:0000006501, Creating pdi.2024-01-20.log-001
2024/08/31 18:55:14 Pos:0000006801, Creating pdi.2024-01-20.log-002
2024/08/31 18:55:14 Pos:0000007101, Creating pdi.2024-01-20.log-003
2024/08/31 18:55:14 Pos:0000007320, Finished.

d:\sandbox>

エンコーディングを指定する

以下はログの文字コード(エンコーディング)にUTF8を指定して2000行毎に分割する例。

d:\sandbox>powershell -File .\splitlog.ps1 -Path pdi.2024-01-20.log -SplitLine 2000 -Encode UTF8
2024/08/31 18:56:11 Pos:0000000000, Start, Skip 0 Lines, Split 2000 Lines, All rows read.
2024/08/31 18:56:11 Pos:0000000001, Creating pdi.2024-01-20.log-001
2024/08/31 18:56:12 Pos:0000002001, Creating pdi.2024-01-20.log-002
2024/08/31 18:56:13 Pos:0000004001, Creating pdi.2024-01-20.log-003
2024/08/31 18:56:14 Pos:0000006001, Creating pdi.2024-01-20.log-004
2024/08/31 18:56:15 Pos:0000007320, Finished.

d:\sandbox>

範囲を指定して分割する

以下は先頭5000行~6000行の間を500行毎に分割している例。

d:\sandbox>powershell -File .\splitlog.ps1 -Path pdi.2024-01-20.log -SkipLine 5000 -LimitLine 6000 -SplitLine 500
2024/08/31 18:58:05 Pos:0000000000, Start, Skip 5000 Lines, Split 500 Lines, Limit 6000 Line.
2024/08/31 18:58:06 Pos:0000005001, Creating pdi.2024-01-20.log-001
2024/08/31 18:58:06 Pos:0000005501, Creating pdi.2024-01-20.log-002
2024/08/31 18:58:06 Pos:0000006000, Finished.

d:\sandbox>

コード

とりあえずやっつけ。

splitlog.ps1
Param(
  $Path,
  $SplitLine=1000,
  $SkipLine=0,
  $LimitLine=0,
  $Encode="Default"
)
 
$SkipFlag = $true
$LineCounter = 0
$BreakCounter = 0
$FileNameIndex = 1
 
$SDate = Get-Date -DisplayHint DateTime
if ($LimitLine -eq 0) {
    Write-Host  ("{0} Pos:{1:0000000000}, Start, Skip {2} Lines, Split {3} Lines, All rows read." -f $SDate, 0, $SkipLine, $SplitLine)
}
else {
    Write-Host  ("{0} Pos:{1:0000000000}, Start, Skip {2} Lines, Split {3} Lines, Limit {4} Line." -f $SDate, 0, $SkipLine, $SplitLine, $LimitLine)
}
 
foreach($line in Get-Content -Path $Path -Encoding $Encode -ErrorAction Stop)
{
    $LineCounter++
 
    if ($SkipFlag -eq $true) {
        if (($SkipLine -eq 0) -or ($LineCounter -gt $SkipLine))
        {
            $SkipFlag = $false
        }
        else {
            continue
        }
    }
 
    if ($BreakCounter -eq 0) {
        $SplitPartFile = "{0}-{1:000}" -f $Path, $FileNameIndex
        $SDate         = Get-Date -DisplayHint DateTime
        $BeginLine     = $LineCounter
 
        Set-Content   -Path $SplitPartFile -Value ""
        Clear-Content -Path $SplitPartFile
 
        Write-Host  ("{0} Pos:{1:0000000000}, Creating {2}" -f $SDate, $BeginLine, $SplitPartFile)
    }
 
    $BreakCounter++
    Add-Content -Path $SplitPartFile -Value $line
 
    if ($BreakCounter -eq $SplitLine) {
        $FileNameIndex++
        $BreakCounter = 0
    }
 
    if (($LimitLine -ne 0) -and ($LineCounter -eq $LimitLine)) {
        break
    }
}
 
$SDate = Get-Date -DisplayHint DateTime
Write-Host  ("{0} Pos:{1:0000000000}, Finished." -f $SDate, $LineCounter)
documents/windows/code/code-009.txt · 最終更新: 2024/09/02 01:10 by k896951

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki