編程學習網 > 編程語言 > Python > Python:如何處理和解析PowerShell CLIXML數據
2024
04-13

Python:如何處理和解析PowerShell CLIXML數據

在使用Windows的Windows Remote Management (WinRM)服務與PowerShell交互時,經常會遇到CLIXML(即CLI XML)格式的數據。這種格式用于序列化和傳輸由PowerShell腳本生成的復雜數據對象。對于使用Python進行自動化任務的開發人員來說,理解如何解析CLIXML數據是一個重要的技能。本文將介紹如何在Python中處理和解析CLIXML數據,并提供一種方法來從數據中提取有效信息。


1. 理解CLIXML
CLIXML是PowerShell用來封裝數據的一種XML格式。它允許PowerShell在不同的會話之間傳輸復雜的對象和異常信息。CLIXML不僅包含數據,還包含關于對象類型和結構的元數據。

2. 準備Python環境
要在Python中處理CLIXML數據,你需要準備好XML解析庫。Python標準庫中的xml.etree.ElementTree是一個輕量級的XML處理庫,非常適合解析CLIXML。首先,確保你的Python環境已經安裝并配置好:

python -m ensurepip
python -m pip install --upgrade pip
3. 解析CLIXML數據
使用xml.etree.ElementTree模塊來解析CLIXML數據。以下是一個基本的示例,展示如何讀取和解析CLIXML數據:

import xml.etree.ElementTree as ET

def parse_clixml(clixml_data):
    namespaces = {'ps': 'http://schemas.microsoft.com/powershell/2004/04'}
    root = ET.fromstring(clixml_data)
    results = {
        'Action Messages': [],
        'Statuses': [],
        'Error Messages': []
    }

    for obj in root.findall('ps:Obj', namespaces):
        for ms in obj.findall('ps:MS', namespaces):
            action_msg = ms.find('.//ps:AV', namespaces)
            status = ms.find('.//ps:T', namespaces)
            if action_msg is not None:
                results['Action Messages'].append(action_msg.text)
            if status is not None:
                results['Statuses'].append(status.text)

    for error in root.findall('ps:S', namespaces):
        if error.attrib['S'] == 'Error':
            results['Error Messages'].append(error.text)

    return results
4. 提取<Objs>到</Objs>之間的內容
在處理從WinRM接收的數據時,可能需要從一段較大的數據中提取出<Objs>標簽內的內容??梢酝ㄟ^字符串操作來實現這一點:

def extract_objs_content(clixml_data):
    start_index = clixml_data.find('<Objs')
    end_index = clixml_data.find('</Objs>') + len('</Objs>')
    return clixml_data[start_index:end_index]
5. 應用場景和示例
假設我們正在開發一個自動化工具,該工具需要從遠程Windows服務器獲取系統信息。通過WinRM和PowerShell腳本,我們可以獲取系統信息,該信息以CLIXML格式返回。使用上述方法,我可以在Python腳本中解析這些數據,并根據需要進行進一步處理。

import xml.etree.ElementTree as ET

def extract_objs_content(clixml_data) -> str:
    # 查找<Objs標簽開始的位置
    start_index = clixml_data.find('<Objs')
    if start_index == -1:
        return "No <Objs> tag found."

    # 查找</Objs>標簽結束的位置
    end_index = clixml_data.find('</Objs>', start_index)
    if end_index == -1:
        return "No </Objs> tag found."

    # 計算</Objs>標簽閉合部分的位置,加上7是因為"</Objs>"的長度
    end_index += len('</Objs>')

    # 返回從<Objs>到</Objs>之間的內容
    return clixml_data[start_index:end_index]

def parse_clixml(clixml_data):
    # 創建命名空間字典,因為CLIXML使用了命名空間
    namespaces = {'ps': 'http://schemas.microsoft.com/powershell/2004/04'}

    # 解析 XML
    root = ET.fromstring(clixml_data)

    results = {
        'Action Messages': [],
        'Statuses': [],
        'Error Messages': []
    }

    # 遍歷所有的Obj標簽,處理進度信息
    for obj in root.findall('ps:Obj', namespaces):
        for ms in obj.findall('ps:MS', namespaces):
            action_msg = ms.find('.//ps:AV', namespaces)
            status = ms.find('.//ps:T', namespaces)
            if action_msg is not None:
                results['Action Messages'].append(action_msg.text)
            if status is not None:
                results['Statuses'].append(status.text)

    # 遍歷所有錯誤信息
    for error in root.findall('ps:S', namespaces):
        if error.attrib['S'] == 'Error':
            results['Error Messages'].append(error.text)

    return results

# 示例使用
clixml_data = '''
CLIXML  
<Objs Version="1.1.0.1" xmlns="http://schemas.microsoft.com/powershell/2004/04">
    <Obj S="progress" RefId="0">
        <TN RefId="0">
            <T>System.Management.Automation.PSCustomObject</T>
            <T>System.Object</T>
        </TN>
        <MS>
            <I64 N="SourceId">1</I64>
            <PR N="Record">
                <AV>Preparing modules for first use.</AV>
                <AI>0</AI>
                <Nil/>
                <PI>-1</PI>
                <PC>-1</PC>
                <T>Completed</T>
                <SR>-1</SR>
                <SD> </SD>
            </PR>
        </MS>
    </Obj>
    <S S="Error">Set-ADAccountPassword : The specified network password is not correct</S>
</Objs>
'''

results = parse_clixml(extract_objs_content(clixml_data))
print(results)


python3 c:/src/uml/2024/0412/xml_extract.py
{'Action Messages': ['Preparing modules for first use.'], 'Statuses': ['Completed'], 'Error Messages': ['Set-ADAccountPassword : The specified network password is not correct']}
PS C:\src\uml>
結論

掌握如何在Python中處理CLIXML數據,對于需要與Windows PowerShell進行交互的自動化和遠程管理任務非常有用。通過合理使用Python的XML處理庫,可以有效地解析和提取CLIXML數據中的關鍵信息,從而為各種應用場景提供支持。

以上就是 Python:如何處理和解析PowerShell CLIXML數據的詳細內容,想要了解更多Python教程歡迎持續關注編程學習網。

掃碼二維碼 獲取免費視頻學習資料

Python編程學習

查 看2022高級編程視頻教程免費獲取