本地上传
导入与合并
先导入当前数据,再单独配置第二份数据的合并方式,避免所有入口挤在同一块里。
导入当前数据
本地上传、平台数据库和粘贴文本三种入口拆成独立卡片。
平台数据库
先搜索再选择数据表
未选择数据表
粘贴文本
合并第二份数据
把数据来源、合并方式和执行区拆成三块,布局更稳定。
第二份数据来源
未选择数据表
合并方式与键
执行合并
追加会自动对齐列;横向绑定要求两份数据长度一致;按键匹配会返回匹配率、重复键风险和未匹配提示。
变量操作
把变量改名、变量说明、类型转换和删除变量拆开处理,每次只专注一个动作。
变量改名
逐个重命名,避免整张表同时编辑导致拥挤和误操作。
导入数据后可批量编辑变量名称。
变量说明
为单个变量补充学术含义或来源说明,便于后续导出与论文撰写。
导入数据后可批量编辑变量说明。
变量类型转换
适合批量选择后统一转型,结果会返回转换失败数量。
删除变量
单独做成删除卡片,避免和改名、类型转换混在一起。
删除后会生成新版本,仍可通过撤销或历史版本恢复。
样本处理
把缺失、重复、异常、筛选和抽样拆成独立卡片,参数区域按同一网格对齐。
缺失值处理
重复值处理
留空时按全部变量判断重复。
异常值处理
随机抽样
条件筛选
筛选条件改成独立大卡片,避免被其他功能挤压。
筛选器支持有限层级的 AND/OR 分组,后端只接收结构化 JSON,不接受任意代码表达式。
变量生成
每种生成方式拆成单独卡片,避免同一屏里堆太多列表框和输入框。
对数变量
比率变量
交互项
支持 2 到 3 个数值变量;若变量是 0/1 虚拟变量,结果提示会额外说明交互含义。
虚拟变量
滞后项
只有滞后项需要面板结构设置;如果时间变量有重复值但未设置个体变量,系统会阻止生成。
差分项
只有差分项需要面板结构设置;如果时间变量有重复值但未设置个体变量,系统会阻止生成。
标准化
中心化
综合指标
把熵值法、PCA 和因子分析拆成三张独立算法卡片,便于单独设置与理解输出。
熵值法
选择指标后自动生成方向设置
PCA 主成分分析
因子分析
当前数据快照
把原来空着的下半区换成随数据状态自动更新的摘要。
当前来源
未导入
数据规模
0 行 / 0 列
版本进度
v0 / v0
历史记录
0 条
先导入数据,系统才会生成可撤销的处理快照。
当前功能提示
切换左侧功能时,这里会同步提示输入重点和输出结果。
当前工作区会根据你选中的处理功能,只保留一张主操作卡片,其他说明收纳到这里。