特征缺失值处理有哪些方法?
1、删除法:直接删除含有缺失值的样本或特征,但这可能导致数据的丢失。
2、填补法:使用一个固定的值、平均值、中位数、众数等代替缺失值,但这可能影响数据的分布。
3、插值法:使用插值方法(如线性插值、拉格朗日插值、径向基函数插值)来预测缺失值。
4、分箱法:将连续的特征分成若干箱,缺失值用该特征对应的箱的中位数代替。
5、模型预测法:使用其他已有的预测模型预测缺失值,如回归模型、KNN算法等。
通过记忆进行推理。近邻知识图谱嵌入
以前的知识图谱嵌入方法通常将实体映射到表征中,并利用分数函数来预测目标实体,但它们在推理稀有或新出现的未见过的实体时却很困难。在本文中,我们提出了kNN-KGE,一种新的知识图谱嵌入方法,通过线性插值其实体分布与k-最近的邻居。我们根据实体嵌入空间中与知识库的距离来计算最近的邻居。我们的方法可以让稀有或新出现的实体明确地被记忆,而不是隐含在模型参数中。实验结果表明,我们的方法可以改善归纳式和反导式链接的预测结果,并在只有几个三元组的低资源环境下产生更好的性能,这可能更容易通过显式记忆来推理。
《Reasoning Through Memorization: Nearest Neighbor Knowledge Graph Embeddings》
论文地址:网页链接
百亿级监控场景大数据分位值计算是一项非常复杂和挑战性的任务,需要使用高效的算法和技术来处理海量数据。下面是一些可能有助于解决此问题的实践方法:
数据分布分析:在计算分位值之前,需要了解数据的分布情况,例如数据的最大值、最小值、中位数、标准差等。这可以帮助确定选择哪种分位值计算方法以及如何优化计算性能。
分位值计算方法选择:常见的分位值计算方法包括插值法、线性插值法、基于直方图的方法等等。针对不同的数据分布情况,选择合适的计算方法可以有效提高计算效率和准确性。
分布式计算框架:对于海量数据的分位值计算,使用分布式计算框架可以提高计算效率和处理能力。例如Hadoop、Spark等分布式计算框架可以将大规模的计算任务分解为多个子任务进行并行计算,从而减少计算时间和资源消耗。
压缩算法:在存储和传输大规模数据时,使用压缩算法可以有效减小数据量,降低存储和传输成本。例如Gzip、LZO等压缩算法可以在保证数据完整性的前提下,显著减小数据的体积。
数据分片和缓存:在处理大规模数据时,可以将数据分片处理,分别计算分位值,然后再将结果合并。此外,可以使用缓存机制来缓存已经计算过的数据,避免重复计算,提高计算效率。
百亿级监控场景大数据分位值计算需要使用多种方法和技术来处理,包括数据分布分析、分位值计算方法选择、分布式计算框架、压缩算法、数据分片和缓存等。通过合理地运用这些技术,可以提高计算效率和准确性,有效地处理大规模数据。
PT100测温电路的软件标定算法
经过昨晚的分析,我最终决定采用下图的电路对PT100的阻值进行测量。
当软件的ADC模块将该电路输出的电压得到了AD值之后,需要将AD值转换为温度值。
假设温度为t℃,根据PT100的阻值与温度关系式,
-200<t<0℃ Rt=R0[1+At+Bt*t] ,公式
(1)
Rt为t℃时的电阻值,R0为0℃时的阻值。
其中A=3.9083e-
3、 B=-5.775e-
7。
而分析PT100阻值测量的电路,得到AD值与PT100的阻值关系,如附图2所示,
根据公式1以及公式
2,在excel表格中,计算温度从-20℃~120℃时相对应的AD值,如附图3所示,
从公式2可知,AD与温度t的关系并不是线性关系,而当用线性关系进行转换时,在转换时就会引入误差。
在附图3中,A列为AD值,B列为根据公式1和公式2得到的温度值,而C列为从AD值经过线性转换得到的温度值。
在excel中可以通过slope函数得到线性转换的斜率,通过intercept函数得到线性转换的截距。
从数值结果来看,在高、低温区都会有近1℃的转换误差。
为了减小转换误差,可以采用查表分段线性化的方法进行标定转换。
在-20℃~120℃之间,以1℃为一个区间,共140个区间。
在每一个区间用线性插值的方法做线性转换。
我曾经给你说过,最小二乘算法矩阵是不断进化学习的,是系统每次运行一次的输出数据,反馈回来替换算法矩阵的一列数据。BP算法其实也类似于此,只是它是用神经网络输出与教师数据的差值,经过某个策略,你比如,用遗传算法、进化算法、模拟退火算法、深度卷积算法等修改神经网络权值(矩阵或张量)。
实际上,自然界的任何系统都可先看作一“黑箱”,给其一输入就会有一相应输出。我们探索自然界规律或叫奥秘,就是想找到这个黑箱的结构和其形式的表达(一般是函数形式)。
通常这个黑箱系统分为两大类:一类是冷冰冰的、毫无生机的无机系统,典型的,像晶体、石头、金属等;二类是有机生命系统,有机物、生物系统等。
第一类就是线性系统或叫线性可分,或可表达为线性形式的系统。这类系统,说白了,可表达在一个矩阵,或张量形式的线性空间上,就是这个线性空间,可由一组线性无关的向量作为基底撑起来,类似一幢房子由4根立柱撑起来一样。这里的向量不限于是数,它可以是函数;也就是说,这个线性空间由一组坐标系撑起来;坐标系的每一个坐标轴是一个函数或一个数集合;坐标轴之间必须满足正交性或叫广义垂直性,就是两个数集的垂直正交。
自然界从根本上就是由第一类系统“打底”组成的;第二类系统是在第一类系统的相互相作用下生成的,是非线性系统或叫线性不可分系统,有一部分是在局域线性可分或线性可表达系统,或叫局域的线性可逼近系统。
生命、生物系统是由DNA编码的非线性系统,只能说它是局域的线性可表达系统;他是由4种碱基对,编码在一个非等长码的群空间上,说白了,将来还是可以找到其形式。
但是,智慧生物的意识,或叫情感和抽象思维系统,或叫智慧生物的认知逻辑系统,这是本质非线性系统,没法线性可分或线性形式的表达。目前,人工智能都是通过模拟智慧生物系统的外在性质,而只能做到局域的线性逼近或线性表达在一个张量线性空间上而已。人类的智能,是用量子多值逻辑的“犁”,深耕或叫挖掘在自然的知识海洋,叫做知识挖掘,是可以挖掘语义信息、语用信息、语效信息等高级信息形式中的规律。人工智能只能利用数理逻辑,挖掘数集上的初级信息---数的序,这叫做数据挖掘。数据挖掘与知识挖掘永远隔着一道不可逾越鸿沟,也就是量子多值逻辑,没办法由数理逻辑线性表达。这也就是现在的所有的基于经典计算机程序(语言),构建的量子算法都是伪量子算法;由经典的逻辑门器件,搭建出的量子逻辑门器件,都是自欺欺人的量子器件。
人类目前的人工智能成就,只是吃科技发展的红利而已。目前人工智能所做的“高级事务”,都是将领域中的语义等高级信息形式,映射到某个数集以后,在数集上所进行的数据挖掘而已。所以,我一再叮嘱你要做、要学的,人工智能的最关键技能就是,将任务的语义等高级信息做映射转换工作。
自然界任何一个系统在时空中运行,不论是实在的位移,还是系统内部的时间演化,都可看作是一幢“房子”,在时空中做坐标变换;这里时间是永恒的隐变量,即便系统没有空间的运动位移,但必然、必须有其内部的时空变换运动形成的系统演化。
通常火车、汽车、轮船的运动,都是通过以地球(大地)为参照系,由火车、汽车、轮船与地球相互相作用而建立了一个能量梯度场,在这个能量梯度场做坐标变换运动(假设火车、汽车、轮船外形不变)。
还有一种系统的运动,如龙卷风运动,它是依赖龙卷风的拓扑形变产生的运动。由于龙卷风的拓扑形变,不是由其内部能量控制形成的有序性输出,而是通过与地球相互作用而形成的其拓扑形变梯度带来的有序性输出,从而引起其定向运动。因此,一个可拓扑形变的体系,通过对其内部存储的能量,进行有序控制地输出,从而形成有序运动,这就是我想说的飞碟的动力系统---不喷火、不喷气的“自己抬着自己走”的自履运动系统。
原则上讲,在太空中的一个陀螺运动,只要其自转平面形变时,它就会沿着其“拓扑形变梯度”方向运动。这个“拓扑形变梯度”是一个全新概念,是一个非常有“潜力的方向”。
为了比较 BML 在存在和不存在石油的情况下产生的风浪。
隔离了一部分水面以降低碳氢化合物浓度。一个矩形围油栏 (4.5 × 6 m),固定在
4 个位置,部署在一个固定的仪表柱周围 吊杆臂由市售的直径
7 厘米的泡沫杆构成,并配有一个悬挂在水中 45 厘米的加重塑料裙。在水面相对不含碳氢化合物的时期,吊杆展开并放置了三个星期。吊杆内的引力足够大,因此可以通过风产生均受石油影响的毛细管波和重力毛细管波。吊臂外部产生的短波被吊臂阻挡,但较长的波能够在内部传播。
在整个围栏部署的间歇期,使用
8 兆像素数码相机拍摄围栏内外的水图像。由于波峰和波谷表现为不同的图像光强度,因此可以通过光反射的差异来确定波长。结果发现,分析靠近红色系泊浮标反射边缘的围栏内的波浪可提供最佳对比度,并为波峰和波谷的位置提供更多信心. 此外,在图像中,像素分辨率从精细到粗糙远离前景。为了纠正这种失真,选择了前景和背景中已知长度的对象,并确定了它们的像素长度比。然后通过线性插值分配每行和每列的像素长度比。所分析的波场的每个位置都选择得离吊杆和仪器站足够远,以便将波干扰降至最低。记录了动臂展开期间的风速和风向,并在图像中直观地记录了动臂内外的油量。
石油对波浪槽中产生的风浪的影响可视化显示在时空图中到。此图表示在 28 秒内收集的 2500 张图像中观察到的界面高度的汇编(仅显示中间的 15 秒)。在实验过程中,波场经历了 A-
D 区域指示的
4 次明显的波浪特征变化。最初,在打开风扇之前,水面没有油和波浪 (A)。然后,在风扇启动后,观察到一个发展中的风波场——一个尚未被限制的波场——(B)。由于风在前
5 厘米内没有影响水面,而在后
5 厘米内存在波浪反射,因此忽略了这些区域的结果。在很短的时间内,发展中的风波场转变为完全发展的风波场,波浪以相当均匀的波速、波长和振幅(C)传播。最后,将油涂在水面上,水箱迎风端的波幅立即减小 (D)。几秒后,油污顺风扩散开来,整个风浪场都被阻尼了。
为了更好地理解实验过程中波幅的变化,显示了水槽中心的时间横断面。注意发展中的风浪 (B) 的增长,以及完全发展的风波场 (C) 包含波包,这是色散关系的结果。添加油后,波幅类似于风波场发展初期的波幅(D)。这通过振幅从 (C) 中的 ± 0.15 cm 立即减小到 (D) 中的 ± 0.03 cm 来说明。
为了进一步了解工作中的物理机制,使用 MATLAB ( 2015 )中的快速傅立叶变换 (FFT) 函数计算二维波谱。二维 FFT 允许同时在波数和频率空间中表征波谱。将清洁表面的 带有油膜进行比较,很明显油膜抑制了高频波。这显示为 10 Hz 以上的光谱能量减少和 20 Hz 以上的消除。此外,注意到波能与波幅平方成正比,油具有降低所有波数的波幅的效果。 显示了在 3 cm/s 风流产生的清洁和油污表面上的理论色散关系。
能量在 ω 上求和并绘制为波数的函数。很明显,在存在油膜的情况下,所有波数的能量都小得多。同样明显的是,光谱中的峰值从清洁水表面上的 36 个周期/米(λ = 2.8 厘米)转移到油污染表面上的 27 个周期/米(λ = 3.7 厘米)。这种转变在 95% 的置信水平下具有统计显着性,并且在性质上类似于 Creamer 和 Wright的线性不稳定性分析中显示的转变。 值得注意的是,无论表面污染如何,最长波浪中的能量都不相同,因为石油对长波浪的影响很小。然而,由于实验中产生的波浪从未超过
6 厘米的波长,因此即使是最长的波浪仍然受到油膜的轻微影响也就不足为奇了。如果实验扩展到更小的波数(更长的波长),这些能量很可能会变得相等。
捕获了吊杆内三个位置(A-C)和吊杆外一个位置(D)的风浪特征。定性地,吊杆内的小涟漪 (A–C) 比外面 (D) 多。此时的风是从图像的背景吹向前景,因此在 A-
C 处看到的波浪也向这个方向传播。在吊杆的下风端,即图像前景,吊杆内部有一层油膜,但 A-
C 处没有。这部电影也可以在位置
D 看到。查看显示归一化光强度的 A-
D 图,很明显,吊杆内部有波浪,但外部没有波浪。这符合我们对图3的视觉解释 , 并表示在存在油膜的情况下波场的衰减。
为了了解 AD 处存在的波长,图 7中每个图的 y 垂直横断面如图8所示 。在吊杆内,波的波长范围为 1.0 至 1.4 厘米,它落在色散关系的最小值左侧,表明波主要受表面张力控制。在吊杆外,没有可辨别的波浪
实验室和现场实验的结果表明,在存在油膜的情况下,观测到的风波场发生了巨大变化。据观察,在已经完全发展的风波场上添加油膜起到抑制毛细管波的作用,这表明风波场的增长比没有油膜时要慢。
钢结构设计中防火问题的探讨
《建筑钢结构防火技术规范》GB51249-2017(以下简称范)第32条要求:钢结构应技结构耐火载力极限状态进行而火验算与防火设计。此的钢结构,包括工业与民用建筑中的钢结构以及钢管混凝土柱、压型钢板 混凝土组合楼板、钢与混凝土合梁等组合结构。随着温度的升高,领材的性摸量急剧下隆,钢材的强度会随着钢结构温度的升高而下降,其承载力也随之下峰下图为钢结构升温曲线》。因此,为保证钢结构在设计耐火极限时间内的承载安全,必须进行承载力极限状态验算。由于直接涉及建筑的结构安全,将本条作为规范的强制性条文。
根结构的重要性、类型和荷载持征等,可选用基于整体结构耐火验算或基于构件耐火验算的防火设计方法。其中,跨度不小于60m的大跨度钢结构,宜采用基于整体结构的防火设计方法;预应力钢结构和跨度不小于120m的大跨度钢结构,应采用基于整体结构的防火设计方法。
钢结构构件的耐火验算分为耐火极限法、承载力法或临界温度法。此三种方法在本质上是相同的。下面以临界温法为例,简述其设计方法。
1、按规范第3.2.2条计算构件的最不利荷载效应组合设计值
2、根据构件和荷载类型,按规范第7.2.1条至第7.2.7条计算构件的临界温度Td。
3,按却范第621条计算天防火保护构性车设士和火极限tm时间内的最高温度。比较Td与Tm,当Td大于Tm时,可不进行火保护,当Td小于等于Tm时,按第4、5条确定所需的防火保护。
4、确定防火保护方法,计算构件的截面形状系数。
5、按规范第7.2.8条和第7.2.9条确定防火保护层的厚度。
等效热阻是进行耐火验算时涉及的一个重要参数,是衡量防火保护层防火保护性能的技术指标,对不同类型的防火涂料,根据其特性采用不同的计算方式
+对于非联胀型防火涂料,由于其等效热传导系教与防火保护层的厚度无关,所以可根据防火保护层的等效热阻等原则按附录A确定实际施工厚度,
+对于膨胀型防火涂料,由于其等效热传导系教与防火保护层厚度有关,宜根据等效热阻确定其厚度,且应给出最大使用厚度、最小使用厚度的等效热阻以及防火涂料使用厚度按最大使用厚度与最小使用厚度之差的1/4递增的等效热阻,其他厚度下的等效热阻可采用线性插值方法确定。
另外,钢结构的防火设计文件应注明建筑的耐火等级、构件的设计耐火极限、构件的防火保护措施、防火材料的性能要求及设计指标。(其中,防火保护措施及防火材料的性能要求、设计指标包括:防火保护层的等效热阻、防火保护材料的等效热传导系数、防火保护层的厚度、防火保护的构造等)。
StarRocks-2.4 正式版发布
StarRocks是开源的新一代极速全场景MPP数据库。它采用新一代的弹性MPP架构,可以高效支持大数据量级的多维分析、实时分析、高并发分析等多种数据分析场景。StarRocks 性能出色,它采用了全面向量化技术,比同类产品平均快3-5倍。
新增特性
支持构建多表物化视图,实现多表 JOIN 查询加速。
支持通过 INSERT OVERWRITE 语句批量写入并覆盖数据。
[公测中] 提供无状态的计算节点(Compute Node,简称 CN 节点)。计算节点支持无状态扩缩容,您可通过 StarRocks Operator 部署,并基于 es 管理容器化的计算节点,以此实现自动感知系统负载并水平扩展计算节点。
Outer Join 支持通过 <、<=、>、>=、<> 等比较操作符对多表进行非等值关联。
支持创建 Iceberg catalog 和 Hudi catalog,创建后即可查询 Apache Iceberg 和 Apache Hudi 数据。
支持查询 CSV 格式 Apache Hive™ 表中的 ARRAY 列。
支持通过 DESC 语句查看外部数据的表结构。
支持通过 GRANT 或 REVOKE 语句授予或撤销用户特定角色或 IMPERSONATE 权限,并支持通过 EXECUTE AS 语句使用 IMPERSONATE 权限执行当前会话。
支持 FQDN 访问:您可以用域名或结合主机名与端口的方式作为 FE 或 BE 节点的唯一标识,有效避免因 IP 变更导致无法访问的问题。
flink-connector-starrocks 支持主键模型 Partial Update。
函数相关:
新增 array_contains_all 函数,用于判断特定数组是否为另一数组的子集。
新增 percentile_cont 函数,用于通过线性插值法计算百分位数。
功能优化
主键模型支持持久化 VARCHAR 类型主键索引。自 2.4.0 版本起,主键模型的主键索引磁盘持久化模式和常驻内存模式支持相同的数据类型。
优化外表查询性能。
支持查询 Parquet 格式文件时延迟物化,提升小范围过滤场景下的数据湖查询性能。
查询数据湖时,支持通过合并小型 I/O 以降低存储系统的访问延迟,进而提升外表查询性能。
优化窗口函数性能。
Cross Join 支持谓词下推,性能提升。
统计信息支持直方图,并进一步完善全量统计信息采集。
支持 Tablet 自适应多线程 Scan,降低 Scan 性能对同磁盘 Tablet 数量的依赖,从而可以简化对分桶数量的设定。
支持查询 Apache Hive 中的压缩文本(.txt)文件。
调整了计算默认 PageCache Size 和一致性校验内存的方法,避免多实例部署时的 OOM 问题。
去除数据导入主键模型时的 final_merge 操作,主键模型大数据量单批次导入性能提升至两倍。
支持 Stream Load 事务接口:支持和 Apache Flink®、Apache Kafka® 等其他系统之间实现跨系统的两阶段提交,并提升高并发 Stream Load 导入场景下的性能。
函数相关:
COUNT DISTINCT 支持多个字段,可计算多字段组合去重后的结果数目。
窗口函数 max 和 min 支持滑动窗口。
优化函数 window_funnel 性能。
年度考核定好,百万雄师攻碉堡。年度考核定的差,业绩士气都很差。
岁末年初定年度绩效考核,请参考华为绩效管理核心七要诀。
1、底层逻辑:做绩效管理之前,要先弄明白绩效管理的底层逻辑,确保绩效管理的方向不偏。价值创造上既要重视短期多打粮食KPI,还要重视长期增加土地肥力KPI。价值评价主要针对组织绩效评价,在个人绩效评价上只规定原则和方向。价值分配包括金钱、利益、机会、工作流动、晋升等多个方面。
2、管理对象:企业绩效管理的主要对象应该是组织绩效,而非个人绩效。关注组织绩效的目的是,促进战略达成和横向协同。促进横向协同的主要方式是KPI指标互锁和后端部门承担前端部门的KPI指标。同时,简化个人绩效管理,也能把更多的现场指挥权授予各级干部。
3、指标设计:绩效KPI指标设计要基于组织职责定位分析和业务价值链分析,指标要有差异性,不同发展阶段、不同责任中心、不同行业特征要设置不同的绩效指标。平衡记分卡是较为合理的绩效设计工具。
4、定目标值:KPI目标值设计要基于预算值和历史基线值。目标值要分为底线值、必达值、挑战值,其中底线值是去年实际值,必达值不得低于预算值。低于底线值该指标得零分,防止指标达成难就置之不理。高于挑战值该指标得分封顶,防止单个指标好就不重视其他难达成的指标。KPI实际值位于底线值、必达值、挑战值之间时,则利用线性插值法确定实际得分。
5、关键任务:不能追求所有考核项目的量化。能量化的量化,不能量化的具象化。关键任务是无法量化但是涉及土地肥力的重要考核项目,主要来自目标业绩差距的真因、战略意图的达成、战略控制点的建设。关键任务的衡量标准不能是过程动作,必须是刚性的结果。关键任务不需按点打分,而是分档评价,拉开差距。
6、结果应用:组织绩效原则上与组织奖金包不直接关联,只与获取分享制涉及不到的末端部门的组织奖金包关联。组织绩效结果,影响员工的绩效等级比例,引导员工关注组织绩效结果。以组织绩效结果与干部个人关键举措为主要依据,按照“考评结合”的方法,决定干部的绩效结果,组织绩效好的干部个人绩效不一定好,干部绩效结果出来后,在任免、晋升、淘汰等方面广泛应用。
7、组织保障:关于人的决策实施集体决策,成立行政管理团队,针对不同类别的员工,采取不同的绩效结果评定方式。人力资源部负责绩效管理体系循环,战略管理部负责审核KPI考核项目是否符合战略规划,财经部门负责审核考核项目的KPI目标值是否符合预算要求。通过集体决策的形式,防止权力滥用。
关注我,每日推送原创人力资源、流程管理实战文章。与知识做朋友!
如何评估岩盐中的压力,是否可以设置相关模型,评估这些有多重要?
评估地下应用中的相互作用过程至关重要。人们需要根据氢、碳水化合物或水等资源的地质储存的长期地下完整性来选择地点。重点关注的时间跨度超过数十万年,用于储存或封存化学毒性或核废料、二氧化碳等有害物质。
在人为干预期间和之后,我们依靠地质屏障通过低渗透性、滞留和阻滞机制将储存或处置的材料与更大的水文地质循环隔离开来。屏障岩石还需要具有足够的强度和延展性,以承受由储存空间的建造和运营引起的载荷。理想情况下,岩石可以通过密封或愈合等机制逆转损坏。
有几种现象可能会挑战屏障岩石的完整性。隧道、竖井或洞穴的开挖可能会改变地应力状态并超过弹性变形极限,从而导致渗透率和/或孔隙度增加。温度变化也会导致非弹性变形或破坏屏障岩石的矿物学变化。
本研究涉及压力驱动的流体通过屏障岩石的渗滤。在压力下储存的流体可以作为屏障岩石上的机械负载,打开次级通道,从而损害屏障的完整性。我们特别关注岩盐,它被认为是一种理想的屏障材料,因为它具有延展性、愈合潜力、高导热性和密封性。我们使用岩盐在溶液开采的洞穴、化学毒性和核废料、档案材料等中储存加压流体。
只要流体压力保持在所谓的渗透阈值以下,未损坏的岩盐几乎是不可渗透的。该阈值由最小主应力和多晶材料晶界的抗拉强度之和给出。高于此阈值,流体压力可以打开晶界并通过连接的晶界网络产生二次渗透率。正是通过这个网络,储存的液体可以逸出。
在这里,我们比较了不同的数值方法重现岩盐中压力驱动流体渗滤的实验观察结果的能力。所考虑的方法是格元法、离散元法和变分相场法。
实施双晶格模型来模拟岩盐样品中的流体驱动渗滤。使用弱耦合方案将施加的液压转换为力学模型,随后确定元件的失效和液压孔径的变化并将其转换回液压模型。所考虑的质量守恒定律可以预测流量和储层压力的变化以及流动和压裂路径,然后将其与实验数据进行比较。
变相模型是一种基于连续介质的方法。在本研究中,控制方程采用线性插值的连续 Galerkin 有限元法进行离散化。该模型代表一个裂纹,它在现实中是一个不连续的尖锐界面,具有数学上扩散的相场变量。因为网格不需要符合不连续性(即裂纹),裂纹扩展不受规定网格的限制。网格大小和方向在一定程度上影响计算的裂缝拓扑,但只要适当设置该方法就能够准确地恢复理论临界能量。
另一方面,离散元和晶格元方法都使用不同的和不连续的实体(离散元和晶格元)来解释机械响应。因此,裂缝可能表现为实体(不同元素或晶格元素)之间的破损。获得显式裂纹属性很简单,因为裂纹被明确表示为尖锐的不连续性。然而,这种表示将裂纹扩展限制在单元的界面上。流体流动也只允许在元素界面处进行,并且在当前的实施中不考虑向岩层的泄漏,但它不受该方法的限制。
就裂纹成核而言,所提供的模型都不需要规定的初始裂纹来促进成核。变分相场模型通过总能量最小化寻求裂纹形核。然而,如果问题没有明确的应力集中,最小化算法可能会陷入局部最小值,并且裂纹成核在这种情况下可能不是唯一的。
然而,与变相场模型情况类似,如果问题中没有明显的应力集中,那么这个最高载荷很可能是单元不规则的结果。在这种情况下,成核也可以是“非唯一的”。具有不同元素尺寸的 DEM 或 LEM 中的这种成核独特性将成为未来研究的主题。
在本研究中考虑的两种加载情况下,即使我们没有规定初始裂纹,钻孔的开口部分也会出现应力集中。将其与各向异性边界载荷相结合,本研究中采用的所有模型都能够识别与最小应力方向正交的传播平面。这些平面在质量上与实验观察相匹配。虽然变分相场模型结果显示由于均匀的机械特性而导致相对光滑的裂纹表面,但 DEM 和 LEM 结果显示更多不规则的主裂纹扩展,这可能是由模型中的异质元素尺寸和位置引起的.
由于岩土材料在晶界之间确实具有这种不规则性,DEM 和 LEM 模拟的破坏模式似乎更真实,而变相场在实施中仍然缺乏这种晶界相互作用。由于这些不规则性,人们可能会得出结论,DEM 或 LEM 更适合模拟岩石开裂。然而,我们应该注意到,材料中的这些不规则性(异质性)在现实中很难表征,尤其是在晶粒尺度上。如果对非均质性进行了表征和分配,则连续介质方法(如变分相场模型)将生成不规则的裂缝拓扑结构。
结论:
我们提出了三种不同的流体压力裂纹扩展数值方法。这些方法都不需要规定的断裂成核点或传播路径。通过对具有不同三轴边界载荷的岩盐进行流体渗滤实验,我们将三种模型与实验结果进行了比较。三种模型根据实验观察模拟了垂直于最小应力的平面上的裂纹扩展。这种预测能力在地下完整性分析中很重要,我们不能先验地假设裂纹成核或传播。
在大规模模型中,虽然这并非不可能,但计算成本会随着离散方法而迅速增加。为了弥合尺度之间的这种差距,多尺度建模框架是未来可能的研究。