Beercow
diff --git a/‎OneDriveExplorer/Images/splashv.png
659 Bytes b/‎OneDriveExplorer/Images/splashv.png
659 Bytes
diff --git a/‎OneDriveExplorer/OneDriveExplorer.py
+9-9 b/‎OneDriveExplorer/OneDriveExplorer.py
+9-9
diff --git a/‎OneDriveExplorer/OneDriveExplorer_GUI.py
+54-27 b/‎OneDriveExplorer/OneDriveExplorer_GUI.py
+54-27
diff --git a/‎OneDriveExplorer/ode/parsers/csv_file.py
+3-4 b/‎OneDriveExplorer/ode/parsers/csv_file.py
+3-4
diff --git a/‎OneDriveExplorer/ode/parsers/dat.py
+7-2 b/‎OneDriveExplorer/ode/parsers/dat.py
+7-2
@@ -50,7 +50,7 @@
                     )
 
 __author__ = "Brian Maloney"
-__version__ = "2024.07.24"
+__version__ = "2024.09.20"
 __email__ = "bmmaloney97@gmail.com"
 rbin = []
 DATParser = dat_parser.DATParser()
@@ -205,10 +205,10 @@ def output():
             name = f'{sql_find[0][0]}_{sql_find[0][1]}'
         except Exception:
             name = 'SQLite_DB'
-        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account = SQLiteParser.parse_sql(args.sql)
+        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account, localHashAlgorithm = SQLiteParser.parse_sql(args.sql)
 
         if not df.empty:
-            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, args.sql, rbin_df, account, args.reghive, args.RECYCLE_BIN)
+            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, args.sql, rbin_df, account, args.reghive, args.RECYCLE_BIN, localHashAlgorithm)
 
         if df.empty:
             print(f'Unable to parse {name} sqlite database.')
@@ -231,10 +231,10 @@ def output():
         account = os.path.dirname(args.file.replace('/', '\\')).rsplit('\\', 1)[-1]
         name = os.path.split(args.file)[1]
 
-        df, rbin_df, df_scope, scopeID = DATParser.parse_dat(args.file, account)
+        df, rbin_df, df_scope, scopeID, localHashAlgorithm = DATParser.parse_dat(args.file, account)
 
         if not df.empty:
-            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, args.file,  rbin_df, account, args.reghive, args.RECYCLE_BIN)
+            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, args.file,  rbin_df, account, args.reghive, args.RECYCLE_BIN, localHashAlgorithm)
 
         if df.empty:
             filename = args.file.replace('/', '\\')
@@ -313,10 +313,10 @@ def output():
                         account = os.path.dirname(filename.replace('/', '\\')).rsplit('\\', 1)[-1]
                         name = os.path.split(filename)[1]
 
-                        df, rbin_df, df_scope, scopeID = DATParser.parse_dat(filename, account)
+                        df, rbin_df, df_scope, scopeID, localHashAlgorithm = DATParser.parse_dat(filename, account)
 
                         if not df.empty:
-                            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, filename,  rbin_df, account, args.reghive, args.RECYCLE_BIN)
+                            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, filename,  rbin_df, account, args.reghive, args.RECYCLE_BIN, localHashAlgorithm)
 
                         if df.empty:
                             filename = filename.replace('/', '\\')
@@ -330,10 +330,10 @@ def output():
                     for account, sql_dir in v.items():
                         name = f'{key}_{account}'
 
-                        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account = SQLiteParser.parse_sql(sql_dir)
+                        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account, localHashAlgorithm = SQLiteParser.parse_sql(sql_dir)
 
                         if not df.empty:
-                            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, sql_dir, rbin_df, account, args.reghive, args.RECYCLE_BIN)
+                            cache, rbin_df = OneDriveParser.parse_onedrive(df, df_scope, df_GraphMetadata_Records, scopeID, sql_dir, rbin_df, account, args.reghive, args.RECYCLE_BIN, localHashAlgorithm)
 
                         if df.empty:
                             print(f'Unable to parse {name} sqlite database.')
 
@@ -50,7 +50,6 @@
 import keyboard
 from ruamel.yaml import YAML
 import logging
-from io import StringIO as StringBuffer
 from datetime import datetime
 from cerberus import Validator
 import warnings
@@ -95,15 +94,15 @@
 WS_MINIMIZEBOX = 131072
 WS_MAXIMIZEBOX = 65536
 
-log_capture_string = StringBuffer()
+log_capture_string = StringIO()
 logging.basicConfig(level=logging.INFO,
                     format='%(asctime)s, %(levelname)s, %(message)s',
                     datefmt='%Y-%m-%d %H:%M:%S',
                     handlers=[logging.StreamHandler(log_capture_string)]
                     )
 
 __author__ = "Brian Maloney"
-__version__ = "2024.07.24"
+__version__ = "2024.09.20"
 __email__ = "bmmaloney97@gmail.com"
 rbin = []
 user_logs = {}
@@ -1291,10 +1290,11 @@ def highlight_pattern(self, pattern, tag, start="1.0", end="end", regexp=False):
 
 class Result:
 
-    def __init__(self, master, *args, folder=True, tags=''):
+    def __init__(self, master, *args, folder=True, folderShared='', tags=''):
         self.master = master
         self.args = args
         self.folder = folder
+        self.folderShared = folderShared
         self.tags = tags
         self.type = []
         self.status = []
@@ -1360,7 +1360,7 @@ def handle_folder_status(self, num, values_list):
             ''
         )
 
-        if num == '7' and len(values_list) > 11:
+        if num == '7' and len(values_list) > 12:
             shortcut_item = next((item for item in self.args[0] if 'shortcutitemindex:' in item.lower()), None)
             if shortcut_item and int(shortcut_item.split(' ')[1]) > 0:
                 self.type.clear()
@@ -1372,6 +1372,14 @@ def handle_folder_status(self, num, values_list):
         else:
             self.type.append(self.get_type_image(num))
 
+        sharedItem = next(
+                (item.split(' ')[1] for item in self.args[0] if 'shareditem:' in item.lower() and len(item.split(' ')) > 1), 
+                ''
+            )
+
+        if sharedItem == '1':
+                self.status.append(shared_big_img)
+
         if not set(self.lock_list).intersection(spoPermissions):
             if num not in ('10', '11'):
                 self.status.append(locked_big_img)
@@ -1397,7 +1405,7 @@ def process_non_folder_status(self, values_list):
                     else:
                         self.status.append(self.get_status_image(num))
 
-            if sharedItem == '1':
+            if sharedItem == '1' or self.folderShared == '1':
                 self.status.append(shared_big_img)
 
             if not set(self.lock_list).intersection(spoPermissions) and not any('inrecyclebin:' in item.lower() for item in self.args[0]):
@@ -2086,7 +2094,7 @@ def get_info(self, event):  # need to look into click performance
         # find logs for files/folders
         if any('status:' in value.lower() for value in values):
             # Find the item containing 'resourceID:' and extract the desired part
-            resourceID = next((value.split(" ")[1].split("+")[0] for value in values if 'resourceid:' in value.lower()), '')
+            resourceID = next((value.split(" ")[1].split("+")[0] for value in values if value.lower().startswith('resourceid:')), '')
             # Concatenate DataFrames containing the resource_id
             info = pd.concat([df.loc[df.Params.astype('string').str.contains(f'{resourceID}', case=False, na=False)] for df in df_list])
 
@@ -2182,6 +2190,14 @@ def file_pane(self):
             else:
                 self.status.append(image_mapping.get(folderStatus, online_img))
 
+            sharedItemF = next(
+                        (item.split(' ')[1] for item in values if 'shareditem:' in item.lower() and len(item.split(' ')) > 1), 
+                        ''
+                    )
+
+            if sharedItemF == '1':
+                        self.status.append(shared_img)
+
             if not set(lock_list).intersection(spoPermissions) and str(tags) != 'red':
                 if folderStatus not in ('10', '11', ''):
                     self.status.append(locked_img)
@@ -2193,6 +2209,11 @@ def file_pane(self):
 
         try:
             if cur_item[0] in file_items:
+                folderShared = next(
+                    (item.split(' ')[1] for item in self.tv.item(cur_item[0])["values"] if 'shareditem:' in item.lower() and len(item.split(' ')) > 1),
+                    ''
+                )
+
                 for i in file_items[cur_item[0]]:
                     self.status.clear()
                     item_data_i = self.tv.item(i)
@@ -2229,7 +2250,7 @@ def file_pane(self):
 
                     self.status.append(image_mapping.get(fileStatus, online_img))
 
-                    if sharedItem == '1':
+                    if sharedItem == '1' or folderShared == '1':
                         self.status.append(shared_img)
 
                     if not set(lock_list).intersection(spoPermissions_i) and str(tags_i) != 'red':
@@ -3059,14 +3080,18 @@ def search(item=''):
             image_key = tv.item(child, 'image')[0]
             Result(root, values, child, image_key)
         if child in file_items:
+            folderShared = next(
+                (item.split(' ')[1] for item in tv.item(child, 'values') if 'shareditem:' in item.lower() and len(item.split(' ')) > 1),
+                ''
+            )
             for i in file_items[child]:
                 if query.lower() in str(tv.item(i, 'values')).lower():
                     tags = ''
                     if tv.item(i, 'tags'):
                         tags = 'red'
                     values = tv.item(i, 'values')
                     image_key = tv.item(i, 'image')[0]
-                    Result(root, values, i, image_key, folder=False, tags=tags)
+                    Result(root, values, i, image_key, folder=False, folderShared=folderShared, tags=tags)
         search(item=child)
 
 
@@ -3532,16 +3557,11 @@ def odl(folder_name, csv=False):
     file_manager.tv2.delete(*file_manager.tv2.get_children())
     file_manager.tv3.delete(*file_manager.tv3.get_children())
     key_find = re.compile(r'Users/(?P<user>.*)?/AppData')
-    if csv:
-        key = folder_name.name.split('/')[-1].split('_')[0]
-    else:
-        key = re.findall(key_find, folder_name)
-        if len(key) == 0:
-            key = 'ODL'
-        else:
-            key = key[0]
     pb.stop()
+    start = time.time()
+
     if csv:
+        key = folder_name.name.split('/')[-1].split('_')[0]
         header_list = ['Filename',
                        'File_Index',
                        'Timestamp',
@@ -3576,6 +3596,11 @@ def odl(folder_name, csv=False):
             odl = pd.DataFrame()
             logging.error(f'{folder_name.name} not a valid ODL csv.')
     else:
+        key = re.findall(key_find, folder_name)
+        if len(key) == 0:
+            key = 'ODL'
+        else:
+            key = key[0]
         odl = parse_odl(folder_name, key, pb, value_label, gui=True)
 
     tb = ttk.Frame()
@@ -3606,7 +3631,7 @@ def odl(folder_name, csv=False):
 
     pb.stop()
     pb.configure(mode='determinate')
-    value_label['text'] = "Parsing complete"
+    value_label['text'] = f'Parsing complete. {format((time.time() - start), ".4f")} seconds'
 
     mcount = (len(log_capture_string.getvalue().split('\n')) - 1)
     message['text'] = mcount
@@ -3656,7 +3681,7 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
         account = os.path.dirname(filename.replace('/', '\\')).rsplit('\\', 1)[-1]
         name = os.path.split(filename)[1]
 
-        df, rbin_df, df_scope, scopeID = DATParser.parse_dat(filename, account,
+        df, rbin_df, df_scope, scopeID, localHashAlgorithm = DATParser.parse_dat(filename, account,
                                                              gui=True, pb=pb,
                                                              value_label=value_label)
 
@@ -3668,13 +3693,14 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
                                                            rbin_df, account,
                                                            reghive,
                                                            recbin,
+                                                           localHashAlgorithm=localHashAlgorithm,
                                                            gui=True,
                                                            pb=pb,
                                                            value_label=value_label)
 
         dat = True
 
-    if x == 'Load from SQLite':
+    elif x == 'Load from SQLite':
         filename = filename.replace('/', '\\')
         sql_dir = re.compile(r'\\Users\\(?P<user>.*?)\\AppData\\Local\\Microsoft\\OneDrive\\settings\\(?P<account>.*?)$')
         sql_find = re.findall(sql_dir, filename)
@@ -3686,7 +3712,7 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
         pb.configure(mode='indeterminate')
         value_label['text'] = 'Building folder list. Please wait....'
         pb.start()
-        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account = SQLiteParser.parse_sql(filename)
+        df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID, account, localHashAlgorithm = SQLiteParser.parse_sql(filename)
 
         if not df.empty:
             cache, rbin_df = OneDriveParser.parse_onedrive(df,
@@ -3698,18 +3724,19 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
                                                            account,
                                                            reghive,
                                                            recbin,
+                                                           localHashAlgorithm=localHashAlgorithm,
                                                            gui=True,
                                                            pb=pb,
                                                            value_label=value_label)
         pb.stop()
         dat = True
 
-    if x == 'Import JSON':
+    elif x == 'Import JSON':
         cache = json.load(filename)
         df = pd.DataFrame()
         rbin_df = pd.DataFrame()
 
-    if x == 'Import CSV':
+    elif x == 'Import CSV':
         account = ''
         df, rbin_df, df_scope, df_GraphMetadata_Records, scopeID = parse_csv(filename)
 
@@ -3722,11 +3749,12 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
                                                            account,
                                                            reghive,
                                                            recbin,
+                                                           localHashAlgorithm=False,
                                                            gui=True,
                                                            pb=pb,
                                                            value_label=value_label)
 
-    if x == 'Project':
+    elif x == 'Project':
         name = filename
         pass
 
@@ -3741,11 +3769,10 @@ def start_parsing(x, filename=False, reghive=False, recbin=False, live=False):
         if x == 'Import JSON':
             parent_child(cache, None, True)
             df_GraphMetadata_Records = pd.DataFrame(dfs_to_concat)
-        else:
-            parent_child(cache)
-        if x == 'Import JSON':
             curItem = tv.get_children()[-1]
             file_count, del_count, folder_count = json_count(item=curItem)
+        else:
+            parent_child(cache)
 
         pb.stop()
         pb.configure(mode='determinate')
 
@@ -32,8 +32,8 @@
 def parse_csv(filename):
 
     file = open(filename.name, 'r', encoding='utf-8')
-    columns_to_drop = ['parentResourceId', 'resourceId', 'inRecycleBin', 'volumeId', 'fileId', 'DeleteTimeStamp', 'notificationTime', 'hash']
-    columns_to_drop_2 = ['MountPoint', 'Path', 'fileName', 'graphMetadataJSON', 'spoCompositeID', 'createdBy', 'modifiedBy', 'filePolicies', 'fileExtension', 'lastWriteCount']
+    columns_to_drop = ['parentResourceId', 'resourceId', 'inRecycleBin', 'volumeId', 'fileId', 'DeleteTimeStamp', 'notificationTime', 'hash', 'deletingProcess']
+    columns_to_drop_2 = ['MountPoint', 'fileName', 'graphMetadataJSON', 'spoCompositeID', 'createdBy', 'modifiedBy', 'filePolicies', 'fileExtension', 'lastWriteCount']
 
     dtypes = {'Type': 'object',
               'scopeID': 'object',
@@ -93,7 +93,7 @@ def parse_csv(filename):
                               'deletingProcess']]
             rbin_df = rbin_df.astype(object)
             rbin_df = rbin_df.where(pd.notna(rbin_df), '')
-            df = df.drop(df[df['Type'] == 'Deleteed'].index)
+            df = df.drop(df[df['Type'] == 'Deleted'].index)
             df.drop(columns=columns_to_drop, inplace=True)
         else:
             rbin_df = pd.DataFrame()
@@ -110,7 +110,6 @@ def parse_csv(filename):
         df = df.astype(object)
         df = df.where(pd.notna(df), None)
         df.drop(columns=columns_to_drop_2, inplace=True)
-
     except Exception as e:
         print(e)
         log.error(f'Not a valid csv. {csv_name}')
 
@@ -43,6 +43,7 @@ def __init__(self):
         self.log = logging.getLogger(__name__)
         self.datstruct = cstruct.cstruct()
         self.DAT_DEF = f'{self.application_path}/ode/helpers/structures'
+        self.localHashAlgorithm = 0
         self.datstruct.loadfile(self.DAT_DEF)
         self.dict_1 = {'lastChange': 0,
                        'sharedItem': 0,
@@ -371,6 +372,8 @@ def parse_dat(self, usercid, account='Business', gui=False, pb=False, value_labe
                             block = self.datstruct.DAT_FOLDER_v29_v2c(f.read(chunk))
                         else:
                             block = self.datstruct.DAT_FOLDER_v2d_v36(f.read(chunk))
+                        block._values.update([('sharedItem', '')])
+                        print(dict(block._values))
 
                     elif ff == '09':
                         data_type = 'Scope'
@@ -506,12 +509,14 @@ def parse_dat(self, usercid, account='Business', gui=False, pb=False, value_labe
         df_files = df_files.drop(columns=columns)
         if account == 'Personal':
             df_files['localHashDigest'] = df_files['localHashDigest'].apply(lambda x: f'SHA1({x})')
+            self.localHashAlgorithm = 4
         else:
             df_files['localHashDigest'] = df_files['localHashDigest'].apply(lambda x: f'quickXor({codecs.encode(binascii.unhexlify(x), "base64").decode("utf-8").rstrip()})')
+            self.localHashAlgorithm = 5
         df_files['size'] = df_files['size'].apply(lambda x: '0 KB' if x == 0 else f'{x//1024 + 1:,} KB')
         df_files['spoPermissions'] = df_files['spoPermissions'].apply(lambda x: permissions(x))
         df_files['lastChange'] = pd.to_datetime(df_files['lastChange'], unit='s').astype(str)
-        df_folders = pd.read_csv(temp_folders, usecols=['parentScopeID', 'parentResourceID', 'resourceID', 'eTag', 'folderName', 'folderStatus', 'spoPermissions', 'volumeID', 'itemIndex'])
+        df_folders = pd.read_csv(temp_folders, usecols=['parentScopeID', 'parentResourceID', 'resourceID', 'eTag', 'folderName', 'folderStatus', 'spoPermissions', 'volumeID', 'itemIndex', 'sharedItem'])
         temp_folders.close()
         df_folders.insert(0, 'Type', 'Folder')
         df_folders.rename(columns={"folderName": "Name"}, inplace=True)
@@ -521,4 +526,4 @@ def parse_dat(self, usercid, account='Business', gui=False, pb=False, value_labe
         df = pd.concat([df_scope, df_files, df_folders], ignore_index=True, axis=0)
         df = df.where(pd.notnull(df), None)
 
-        return df, pd.DataFrame(), df_scope, scopeID
+        return df, pd.DataFrame(), df_scope, scopeID, self.localHashAlgorithm