导图社区 关于文件命名的规则和建议
我们在电脑上有万千上万的文件,包括word文件、excel文件等等。这些文件怎么命名才方便管理和使用?这里有一些建议和规则供大家参考使用。
编辑于2024-03-20 14:07:25用小到不可能失败的习惯撬动大改变。书籍名称:掌控习惯、原子习惯、Atomic Habits。作者:詹姆斯·科利尔(James Clear)。掌控习惯的四定律:提示、渴求、反应、奖励。
2024年5月印发的《2024年数字乡村发展工作要点》。以信息化驱动引领农业农村现代化,促进农业高质高效、乡村宜居宜业、农民富裕富足,为加快建设网络强国、农业强国提供坚实支撑。《工作要点》明确了工作目标:到2024年底,数字乡村建设取得实质性进展。数字技术保障国家粮食安全、巩固拓展脱贫攻坚成果更加有力。农村宽带接入用户数超过2亿,农村地区互联网普及率提升2个百分点,农产品电商网络零售额突破6300亿元,农业生产信息化率进一步提升,培育一批既懂农业农村、又懂数字技术的实用型人才,打造一批示范性强、带动性广的数字化应用场景,抓好办成一批线上线下联动、群众可感可及的实事。
2024年4月印发的《数字乡村建设指南2.0》,供推进数字乡村建设工作时参考使用。
社区模板帮助中心,点此进入>>
用小到不可能失败的习惯撬动大改变。书籍名称:掌控习惯、原子习惯、Atomic Habits。作者:詹姆斯·科利尔(James Clear)。掌控习惯的四定律:提示、渴求、反应、奖励。
2024年5月印发的《2024年数字乡村发展工作要点》。以信息化驱动引领农业农村现代化,促进农业高质高效、乡村宜居宜业、农民富裕富足,为加快建设网络强国、农业强国提供坚实支撑。《工作要点》明确了工作目标:到2024年底,数字乡村建设取得实质性进展。数字技术保障国家粮食安全、巩固拓展脱贫攻坚成果更加有力。农村宽带接入用户数超过2亿,农村地区互联网普及率提升2个百分点,农产品电商网络零售额突破6300亿元,农业生产信息化率进一步提升,培育一批既懂农业农村、又懂数字技术的实用型人才,打造一批示范性强、带动性广的数字化应用场景,抓好办成一批线上线下联动、群众可感可及的实事。
2024年4月印发的《数字乡村建设指南2.0》,供推进数字乡村建设工作时参考使用。
关于文件命名的规则和建议
一、文件命名
1、介绍
您如何组织和命名文件将对您以后查找这些文件并了解它们包含的内容的能力产生重大影响。
您在命名和组织文件时应该保持一致和描述性,以便清楚地知道在哪里可以找到特定数据以及文件包含的内容。
最好建立一个清晰的目录结构,其中包括项目标题、日期和某种类型的唯一标识符等信息。
可以按日期、研究人员、实验运行或任何对您和您的研究有意义的内容来设置单独的目录。
2、文件如何命名
包括什么
文件名应该允许您从名称中识别出精确的实验。选择一种文件命名格式并一致使用。
您可以考虑在文件名中包含以下一些信息,但也可以包含任何能够区分文件的信息。
项目或实验名称或缩写
位置/空间坐标
研究人员姓名/缩写
实验日期或日期范围
数据类型
状况
文件版本号
应用程序特定文件的三字母文件扩展名
另一个好主意是在目录中包含一个 readme.txt 文件,该文件解释您的命名格式以及您使用的任何缩写或代码。
其他提示
在开发文件命名方案时请考虑以下附加提示:
日期指定的良好格式是 YYYYMMDD 或 YYMMDD。这种格式可确保您的所有文件都按时间顺序排列,即使跨度多年也是如此。
尽量不要让文件名太长,因为长文件名并不适用于所有类型的软件。
特殊字符,例如 ~ !@#$%^&*()`;< >?应避免使用 , [ ] { } ' " 和 |。
使用顺序编号系统时,为了清晰起见,请使用前导零并确保文件按顺序排序。例如,使用“001、002、...010、011...100、101 等”,而不是“1, 2, ...10, 11 ... 100, 101 等”
不要使用空格。有些软件无法识别带空格的文件名,使用命令行时带空格的文件名必须用引号引起来。其他选项包括:
下划线,例如 file_name.xxx
破折号,例如 file-name.xxx
没有分隔符,例如 filename.xxx
驼峰式大小写,文本每个部分的第一个字母大写,例如 FileName.xxx
文件名中可以使用句点,但在此之前请考虑以下几点并谨慎操作:
正则表达式中使用句点。
文件名开头的句点用于指示文件目录中的配置和/或隐藏文件。
句点用于分隔文件名和文件扩展名。
重命名文件的工具
您可能已经为您的项目收集了大量数据,并希望组织和重命名这些文件以便于数据管理。如果您的文件太多而无法手动重命名,请尝试使用以下应用程序之一来重命名文件:
在 Mac 上一次重命名多个项目的提示
https://support.apple.com/guide/mac-help/rename-files-folders-and-disks-on-mac-mchlp1144/mac
高级重命名器(Windows,免费)
https://www.advancedrenamer.com/
批量重命名实用程序 (Windows,免费)
http://www.bulkrenameutility.co.uk/Main_Intro.php
Renamer 6 (Mac iOS 10.14 及更高版本,19.99 美元)
http://renamer4mac.com/
重命名(Linux 命令行工具,免费)
https://www.tecmint.com/rename-multiple-files-in-linux/
3、实例探究
实施例1
这是科学数据馆员 Amy Hodge 在 1997 年至 1999 年间为其论文研究收集的数字研究数据集中的一个示例。它说明了如果您没有为文件建立适当的命名约定,您可能会遇到的一些问题。
好消息
艾米仍然理解这些文件名的某些部分的含义:
DAPI 检测 DNA 的位置。
1-284是指细胞中存在的蛋白质部分。根据这些数字,艾米也知道蛋白质是什么。
12CA5是一种抗体。HA是12CA5识别的抗原。
坏消息
文件名中的某些信息对艾米来说不再有意义。例如,她不再知道“-10”、“-20”或“noPrim”指的是什么。她也不再记得 DM1A 和 3F10 是什么,尽管它们可能是其他抗体。当 12CA5 和 HA 符号用于不同的文件名时,它们是否表示实验的相同内容或不同内容?艾米不知道。
这些文件名还缺少艾米需要知道的大量信息,以便能够理解每个实验是什么,例如每个实验中使用了哪种酵母,是否打开了蛋白质的表达,以及所有那些不包含“1-284”的文件名中存在哪些蛋白质部分。
最佳实践
上面显示的文件命名不一致;一致的命名方案将有助于使他们的名字更容易理解。
在文件名中使用更多描述性信息也可以让 20 多年后更容易找出文件包含的内容。
在此文件夹中包含一个 readme.txt 文件,其中包含实验说明或至少文件的命名方案也会有所帮助。
实施例2
这是 Douglas McCauley 教授和 Fiorenza Micheli 教授领导的小组进行的研究项目的一个例子。它说明了他们用来命名为此项目收集的数千个图像文件的有组织且彻底的方法。
这个调查
该项目涉及在南太平洋帕尔米拉环礁附近的水下区域安装大约 180 块瓷砖,并将它们放置在指定的时间段内。在那段时间结束时,将板取回进行分析。研究人员在研究过程中对盘子进行了拍摄,并在它们被回收后再次拍摄。上图显示了研究期间放置的特定板(左)以及检索后再次放置的板(右)。
研究人员想要追踪有关板块的几件事:
该板安装在哪个研究地点
现场水深
日期
瓷砖数量
瓷砖是否被笼住或松开
相机分配给照片的编号
移除后的照片是整个瓷砖还是仅瓷砖的某个部分
命名约定
以下是为照片确定的一般命名约定:
站点被命名为 FR3、FR7 和 FR9。这些名称用在文件名中。
文件名后紧跟一个字母以指示深度。S=浅,M=中,D=深。接下来是一个句点。
日期格式为 YYMMDD,例如 140623 是 2014 年 6 月 23 日。日期后跟一个句点。
瓷砖编号(这些在瓷砖上)
瓷砖编号后紧跟着一个字母,表示治疗方法。C=有笼子,U=无笼子。接下来是一个句点。
由相机指定的照片编号,后跟句点。
照片报道的单字母名称。W=整个板,A=右上,B=右下,C=左下,D=左上(如果可能的话,瓷砖以统一的方向拍摄)。
例子
右上方显示的示例照片使用此约定命名为
FR3S.140623.129C.2653.W.JPG
这怎么翻译呢?
FR3 = 研究地点 FR3
S = 浅
140623 = 2014 年 6 月 23 日
129 = 瓷砖编号 129
C = 承保治疗
2653 = 相机分配的照片编号
W = 整块瓷砖
想象一下,这些研究人员跟踪这些文件并搜索或扫描数千张图像以查找所有完整的瓷砖图像、所有来自深水的图像或所有已被释放的瓷砖图像将是多么容易。
使用包含有关文件的相关和描述性信息的记录良好且一致的命名方案将使您的研究更快、更容易管理。
并且不要忘记将命名方案文档包含在数据文件夹中的 readme.txt 文件中。
二、文件版本
1、命名您的版本
版本控制是指在进行更改时保存文件的新副本,以便您稍后可以返回并检索文件的特定版本。创建文件的新版本时,记录对文件所做的更改,并为新文件指定唯一的名称。
请遵循网站上命名文件的一般建议,但还要考虑以下事项:
包括版本号,例如“v1”、“v2”或“v2.1”。
Include information about the status of the file, e.g. "draft" or "final," as long as you don't end up with confusing names like "final2" or "final_revised".
包括有关文件状态的信息,例如“草稿”或“最终版”,只要您最终不会出现令人困惑的名称,例如“final2”或“final_revised”。
Include information about what changes were made, e.g. "cropped" or "normalized".
包括有关所做更改的信息,例如“裁剪”或“标准化”。
2、简单的文件版本控制
对文件进行版本控制的一种简单方法是在进行重大更改时手动保存新版本。如果满足以下条件,此方法效果很好:
您不需要保留很多不同的版本。
只有一个人正在处理这些文件。
始终从一个位置访问这些文件。
下面的目录显示了名为 DMSSiteHome.jpg 的网页模型的多个版本。请注意使用 v1、v2 等来指示版本。符号“FISH”和“SandC”表示交换到某些版本的不同图像,即进行的主要更改。
保存多个版本可以让您稍后决定更喜欢早期版本。然后,您可以立即恢复到该版本,而不必重新执行步骤来重新创建它。
这种版本控制方法要求您记住在适当的时候保存新版本。当与多人协作处理文档时,此方法可能会变得混乱。
3、软件选项
基本的
Google 云端硬盘的文字处理、电子表格和演示软件会在您编辑时自动创建版本。
每当您编辑在 Google 云端硬盘上创建的文件时,都会随时保存新版本。
版本信息包括谁正在编辑文件以及创建新版本的日期和时间。
您还可以查看从一个版本到下一个版本(或当前版本和任何旧版本之间)所做的更改,并随时恢复到以前的版本。
优点:
实时编辑功能意味着 Google Drive 非常适合与多人协作处理文件。由于这些文件位于 Google 云端硬盘上,因此可以从任何地方访问它们。
缺点:
您只能使用 Google 提供的软件,该软件可能不具备桌面文字处理、电子表格或演示软件的所有功能。此外,谷歌还做了一些称为“版本修剪”的事情。随着文档老化,保存的旧版本会减少,从而更难以返回到特定状态。有意保存重要版本有助于缓解此问题。
更多:
了解有关使用斯坦福大学 Google Drive 的更多信息。
https://itservices.stanford.edu/service/googleapps/drive
先进的
如果您有更复杂的版本控制需求,您可能会考虑分布式版本控制系统,例如git。文件保存在存储库中。用户克隆存储库的副本以进行编辑,并在完成后将更改提交回存储库。
像 git 这样的版本控制系统经常用于编写软件和代码的团队,但也可以用于任何类型的文件或项目。许多人在GitHub上分享他们的 git 存储库
http://git-scm.com/
https://github.com/
三、存储和备份文件
1、概述
贮存Storage
Storage
Storage of data is typically done in an easily-accessible, secondary location. The data are usually mirrored, which means that the data in the secondary location is identical to the original version.
When deciding on what type of storage solution you will use, you will need to think about several things, such as how much storage you need, what your budget is for storage, what platform you are using, and whether you have data security issues.
Stanford's IT Services has an easy-to-use table of storage solutions that are available on campus.
数据存储通常在易于访问的辅助位置完成。数据通常是镜像的,这意味着辅助位置中的数据与原始版本相同。在决定使用哪种类型的存储解决方案时,您需要考虑几件事,例如您需要多少存储、您的存储预算是多少、您使用的平台以及您是否存在数据安全问题。
斯坦福大学的 IT 服务部门有一个易于使用的存储解决方案表,可在校园内使用。
备份Backup
Backup
Backup of data is typically done in a separate physical location that may be harder to access than your regular storage space (though not necessarily). Backups are snapshots of the information in your files at a given point in time. Usually only one version of the backup is kept, not multiple versions. The Time Machine software on a Mac is an example of a backup system.
When deciding on what type of backup solution to use for your files, you will need to consider how often you intend to back up your files, whether you need one or multiple backups, and what your budget is for backups.
Stanford's IT Services has an easy-to-use table of backup solutions that are available on campus.
数据备份通常在单独的物理位置完成,该位置可能比常规存储空间更难访问(尽管不一定)。备份是文件中的信息在给定时间点的快照。通常只保留一个版本的备份,而不是多个版本。Mac 上的 Time Machine 软件就是备份系统的一个示例。
在决定对文件使用哪种类型的备份解决方案时,您需要考虑备份文件的频率、是否需要一次或多次备份,以及备份预算是多少。
斯坦福大学的 IT 服务部门有一个易于使用的 备份解决方案表 ,可在校园内使用。
保存Preservation
Preservation
Keep in mind that backing up your data is not the same as, nor is it a replacement for, long-term preservation. See our page on sharing files, including information about the Stanford Digital Repository, for more information about preserving your data for the long-term.
请记住,备份数据与长期保存不同,也不能替代长期保存。请参阅我们的共享文件页面 ,包括有关 斯坦福数字存储库的信息,了解有关长期保存数据的更多信息。
2、敏感数据的注意事项
查看我们有关 处理敏感数据的页面 ,了解有关数据风险分类和处理敏感数据的更多信息。
大学 IT 部门的风险分类网站 在页面底部有一个表格,显示哪些存储和备份选项可用于哪些类别的数据。
3、案例分析
“当斯里尼瓦斯博士看着他一生的作品烧焦的碎片在消防员手中崩溃并掉到地上时,这位学者哭了。”
五十多年后,故事的细节可能会有所不同,但类似的命运可能正在等待着任何缺乏良好数据管理实践的研究人员。
1970 年 4 月 24 日凌晨 5 点刚过,斯里尼瓦斯博士和斯坦福大学行为科学高级研究中心的其他九名学者的办公室刚刚遭到燃烧弹袭击。
1948 年,即印度脱离英国独立后的第二年,斯里尼瓦斯博士在兰普拉的一个小村庄里生活,没有电、没有自来水,也没有隐私。他与炎热、灰尘、昆虫、气味和害虫作斗争,以研究多种姓村庄复杂的人际关系——随着越来越多的某些种姓,特别是婆罗门,搬到城市,这种生活方式正在迅速消失。地区。
斯里尼瓦斯博士了解了乡村生活、农业、社会结构、人际关系和种姓紧张关系。他还更多地了解了自己的祖先根源,因为几代人之前,他的家人就从附近的泰米尔纳德邦搬到了距离兰普拉仅三英里的一个村庄。当他的学业完成后,他又花了二十年左右的时间来整理和分析他精心收集的全套田野笔记。
当他来到斯坦福大学时,他已经制作了多份经过处理的笔记副本,并手写在 5,000 张记事卡上。他的原始田野笔记仍然留在印度,但他处理过的笔记的三份副本毫无疑问处于危险之中。
这是一个令人心碎的故事。
正如他后来回忆的那样,“由于命运的巧合,纵火犯纵火时,我在十八年的时间里处理过的田野调查笔记的所有三份都在我的书房里。”
创建研究数据的多个备份副本是数据管理的重要组成部分,但当所有这些副本都存储在同一个位置并且没有得到很好的保护时,它的效率就会低得多。没有研究人员愿意损失数十年的辛勤工作,但良好的数据管理确实需要时间和精力。 斯坦福大学图书馆的数据管理服务 可以帮助您创建和执行可靠的数据管理计划,这将有助于确保您的数据在您需要时一直存在。
请记住,并不需要纵火犯或桑迪飓风就能毁掉多年的研究。如果您的数据没有得到适当的保护,一台掉落的笔记本电脑或溢出的一杯咖啡也可能造成同样的损害。
研究项目完成后,请考虑利用另一项图书馆服务来长期保存您的数据并与其他人共享—— 斯坦福数字存储库 (SDR)。SDR 中的内容被多次复制,存储在不同类型介质上的不同地理位置,并经过系统审核以验证每一位都得到精确维护。对于每一项数据存储,您都会收到一个持久 URL(如 这个),可以在出版物(或其他地方)中引用该 URL,并且您和其他人可以通过该 URL 访问您的数据。
最后,斯里尼瓦斯博士 主要根据他在兰普拉时期的记忆出版了《记忆中的村庄》 。进行了抢救行动,其中一项是将记录卡的残骸保存在单独的塑料套中以供拍照,另一项是在印度对原始手写日记进行缩微拍摄,以便将它们运往美国并与笔记进行比较。但没有什么可以取代多年的原创工作。
因此,无论是下一次海啸还是大厅里的水线破裂,请通过采用良好的数据管理实践来确保您的数据安全!
资料来源:
明尼苏达州斯里尼瓦斯 记忆中的村庄。伯克利:加利福尼亚大学,1976 年。
桑杰克、罗杰. “火、损失和魔法师的学徒。” 载于 《田野笔记:人类学的形成》,罗杰·桑杰克编辑,34-44。伊萨卡:康奈尔大学出版社,1990 年。
Aarons, Leroy F.“学者寻求收回被燃烧弹轰炸的数据。” 《华盛顿邮报》, 1970 年 6 月 1 日,A2。
斯坦福大学新闻服务。1970 年 4 月 24 日。新闻稿。摘自四三运动网站: http://www.a3m2009.org/archive/1969-1970/69-70/files_1969-1970/69-70_Press_3.pdf。